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PREFACIO 


En los siglos XIX y XX la matemática prolifera y florece como quizás ningún 
otro quehacer del espíritu. Movidos por la misma riqueza y audacia de sus 
invenciones, algunos matemáticos notables se ponen a reflexionar sobre la 
naturaleza y alcance de su actividad. Su reflexión es lo que se llama filosófica, 
y así la entienden; pero la conducen como matemáticos que son, aunando 
libertad y rigor, fantasía ubérrima y precisión pedante, en el estilo propio de 
su disciplina. Esta filosofía matemática de la matemática existe de dos mane- 
ras. Por una parte, hay una corriente más o menos unitaria de pensamiento 
que ejerce una enorme influencia sobre la investigación matemática y ha 
llegado a dominar la enseñanza universitaria. Esta corriente se autodenomina 
“clásica”, pero la llamaré “conjuntista” porque coloca al centro de la mate- 
mática, en una forma u otra, la noción de conjunto y trabaja en fortalecerla. 
Iniciada por Dedekind (1831-1916) y Cantor (1845-1918), incorpora logros 
de Frege (1848-1925), Peano (1858-1932), Whitehead (1861-1947) y Russell 
(1872-1970), y recibe aportes de Hilbert (1862-1943), Zermelo (1871-1953), 
Tarski1 (1902-1983), von Neumann (1903-1957), Gódel (1906-1978), Gent- 
zen (1909-1945), y muchos otros. Por otra parte, están los adversarios del 
conjuntismo — ilustres matemáticos como Kronecker (1823-1891), Poincaré 
(1854-1912), Brouwer (1881-1955) y Weyl (1885-1955), filósofos como 
Wittgenstein (1889-1951) y Lorenzen (1915-1994)— que impugnan con 
poderosas razones sus ideas y prácticas más arraigadas, sin que la masa de 
los matemáticos les preste mucha atención. 

Este libro es una historia razonada de la tradición conjuntista, desde los 
primeros escritos de Cantor hasta la publicación de los teoremas de Cohen 
(1963) y su impacto inmediato. Hago una que otra alusión a Kronecker y 
me ocupo, cuando hace falta, de Poincaré, pero la importante oposición de 
Brouwer y Weyl sólo la menciono al paso, sin analizarla, porque el propio 
Hilbert, que explícitamente define su empresa filosófica como una defensa de 
las matemáticas contra ellos, no se dio el trabajo de estudiarlos. Con todo, 
para el lector curioso, explico brevemente en el Apéndice XIX algunas ideas 
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de Brouwer que preceden y motivan la declaración de guerra de Hilbert. En 
cambio, no me ha parecido oportuno examinar en el presente contexto la 
fundamentación constructivista del análisis, propuesta inicialmente por Weyl 
(1918), poco antes de su conversión al brouwerismo, y desarrollada mucho 
más tarde por Lorenzen (1965) y Bishop (1967). 

El libro consta de tres partes, correspondientes a tres etapas en la historia 
del conjuntismo. El presente volumen contiene las partes 1 y 2. La parte 3 
todavía no está escrita. La parte 1, titulada “Conjuntos”, se refiere a la fun- 
dación de la teoría de conjuntos por Cantor, las paradojas que se le enrostran, 
y la axiomatización de la teoría por Zermelo (1908) y sus continuadores. La 
parte 2, titulada “Cálculos” gira en torno al programa de Hilbert para darle 
a la teoría de conjuntos un fundamento intuitivo incontestable, garantizando 
así a los matemáticos el disfrute del paraíso que —según frase del mismo 
Hilbert— Cantor ha creado para ellos. Estudia los antecedentes de dicho 
programa en las obras de Frege, Peano, Dedekind, Russell y Whitehead, y 
Skolem; su desarrollo en la década de 1920 por Hilbert y sus seguidores; y 
el inesperado escollo que le salió al encuentro con los hallazgos de Gódel. 
La parte 3, “Modelos”, examinará la contribución al conjuntismo de los 
métodos semánticos introducidos desde 1930 por Gódel y Tarski. 

Pienso que el libro puede servir como introducción histórica al tema. 
Para leerlo, no es preciso tener conocimientos previos al respecto, pero sí 
el hábito de leer definiciones y demostraciones matemáticas. Cualquiera que 
haya seguido cursos universitarios de matemáticas por más de un año tiene 
ese hábito en la medida requerida aquí. Por otra parte, creo que una persona 
acostumbrada a leer prosa filosófica puede adquirirlo directamente en este 
mismo libro. Supongo, sí, que el lector filósofo que se interese en él habrá 
hecho estudios de lógica. Por otra parte, confío en que el lector con educa- 
ción matemática pero sin estudios de lógica podrá extraer del Apéndice IX 
(pp. 480-502) toda la información requerida. 

En general explico cada término técnico la primera vez que lo uso. (El 
índice analítico permitirá ubicar rápidamente tales explicaciones). Pero la 
terminología lógica se presenta sistemáticamente en el Apéndice IX, y en el 
Glosario que sigue a los apéndices defino algunos términos de uso común 
entre los matemáticos, que los lectores que vienen de la filosofía tal vez 
desconocen (estos términos se señalan con una +). Con rarísimas excepcio- 
nes, expresamente señaladas, me atengo a la terminología estándar, aunque 
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no me parece afortunada en todos los casos. Si las investigaciones lógico- 
matemáticas a que se refiere este libro hubiesen sido conducidas principal- 
mente por personas de habla castellana, con seguridad estaríamos usando 
términos más eufónicos o elocuentes. Tal como han sido las cosas, tenemos 
que arreglárnoslas con palabras tan feas como “completud” (para nombrar la 
propiedad de ser o estar completo) o tan opacas como “consistencia” (para 
decir ausencia de contradicción). 

Las referencias bibliográficas se dan en forma abreviada. Las abreviaturas 
se explican en la lista de obras citadas que va al final. Constan, generalmente, 
del nombre del autor y el año de publicación. Cuando se cita más de una 
obra de un autor aparecida en el mismo año, la segunda, tercera, etc., se 
distinguen con las letras “a”, “b”,... Cuando el año de la edición citada no 
informa sobre la cronología de la obra, la referencia abreviada contiene, en 
vez de la fecha, una sigla alusiva al título. 


El libro se publica con el patrocinio de la Universidad Nacional Andrés 
Bello. Estoy muy agradecido a esta Universidad, y especialmente al Rector 
Joaquín Barceló, por su decisivo apoyo. Agradezco también a la Editorial 
Universitaria y en particular al editor, Sr. Braulio Fernández, por su interés 
en la pronta aparición del libro. 

Escribí un borrador, muy próximo ya al presente texto, entre 1990 y 1994, 
cuando aún ocupaba una cátedra de filosofía en el Recinto de Río Piedras 
de la Universidad de Puerto Rico. Hago público aquí mi agradecimiento al 
Rector y la Junta Universitaria por la liberalidad con que me concedieron el 
tiempo necesario para este proyecto. Doy asimismo las gracias a las bibliote- 
carias y bibliotecarios del Recinto que adquirieron y catalogaron de urgencia 
publicaciones nuevas que me hacían falta, hicieron venir en préstamo desde 
bibliotecas del continente otras ya agotadas, y con invariable amabilidad y 
diligencia atendieron a mi voraz demanda de fotocopias. 

Jorge López Fernández, Francisco Rodríguez Consuegra y Matthias Schirn 
leyeron el susodicho borrador y propusieron importantes mejoras. Atendiendo 
a las indicaciones de Rodríguez Consuegra redacté nuevamente buena parte 
del capítulo sobre la teoría de los tipos de Russell ($ 2.4), y siguiendo el 
consejo de Schirn amplié bastante —aunque no tanto, quizás, como él que- 
ría— la discusión filosófica del programa de Hilbert ($ 2.9). Doy aquí las 
gracias a estos buenos amigos por su valiosa ayuda. Como ninguno de ellos 
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ha visto la versión final, no puede caberles responsabilidad alguna por los 
errores que todavía contiene. 

Este libro, al igual que otros que he publicado anteriormente, no habría 
sido posible sin el apoyo continuo de Carla Cordua. Por la índole del texto, 
esta vez fueron pocos los pasajes que le infligí a medio redactar, pidiéndole 
que me puliera el estilo. Pero es claro que, de no ser por ella, todo este 
trabajo no me hubiera valido la pena. 

Aunque mi afición a la filosofía de las matemáticas (y la física) data de 
los años cuarenta, no habría alcanzado nunca la intensidad que se advertirá 
en estas páginas, si Enrique d'Étigny y Joaquín Cordua no hubieran tenido 
la idea de llevarme, en los años sesenta, a enseñar filosofía a la Facultad de 
Ciencias Físicas y Matemáticas de la Universidad de Chile. En recuerdo de 
esos buenos tiempos, les dedico el libro, con gratitud y afecto. 


Santiago de Chile, 31 de mayo de 1998. 


CONJUNTOS 


1.1 LA PALABRA *CONJUNTO” 
EN LA MATEMÁTICA DEL SIGLO XX 


La palabra “conjunto” (alemán, “Menge”; francés, “ensemble”; inglés, *set”) 
figura destacadamente en la literatura matemática contemporánea. Los cur- 
sos y manuales universitarios suelen presentar su respectivo campo como 
una especie de “conjuntos”, caracterizada por ciertas condiciones que han 
de cumplir los “elementos” —por lo demás indeterminados— de cualquier 
“conjunto” de esa especie, o de ciertos otros “conjuntos” generados desde 
él mediante operaciones estándar. El estudio de ese campo consiste entonces 
en determinar las consecuencias de tales condiciones generales, o de otras, 
más estrechas, mediante las cuales se caracterizan una o más subespecies 
interesantes de la especie inicial.' 

Aunque los matemáticos ceden de buen grado a la tentación de usar pala- 
bras corrientes del idioma en acepciones peculiarísimas inventadas por ellos, 
parece que toman la palabra “conjunto” en su significado habitual o, en todo 
caso, en uno muy próximo a éste.? Salvo por las dos excepciones que co- 
mentaré en los próximos párrafos, la palabra “conjunto” normalmente designa 
en la literatura matemática una colección de objetos de cualquier clase —los 


Véanse en el Glosario las definiciones de “espacio topológico”, “grupo”, “grupo abeliano”. 
En lo sucesivo, el símbolo f a continuación de una palabra, o al comienzo y al final 
de una expresión, sirve para advertir que esa palabra o expresión está explicada en el 
Glosario. 

En su útil Introducción filosófica a la teoría de conjuntos (1990), Stephen Pollard 
combate este parecer. Según él, “es una locura” suponer que los conjuntos de los 
matemáticos son objetos familiares a todo el mundo (p. 12) y la creencia de que “el 
desarrollo de la teoría matemática de conjuntos ha sido significativamente influenciado 
por nociones tomadas directamente del pensamiento cotidiano” es un “mito” (p. 14). 
Como reacción contra la manía pedagógica de enseñarle teoría de conjuntos a los 
párvulos estas aseveraciones de Pollard son muy comprensibles, pero pervierten los 
hechos. El geómetra que habla del grupo formado por el conjunto de las simetrías 
del cubo y el aficionado a la música que habla de tal o cual conjunto instrumental no 
emplean la palabra “conjunto” en acepciones radicalmente diferentes. 
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elementos del conjunto— reunidos en la realidad o en el pensamiento del 
estudioso. “Objeto” debe entenderse aquí en el sentido más amplio posible, 
sin hacer diferencias entre lo real y lo imaginario, o entre lo sustancial y lo 
accidental. La reunión de tales o cuales elementos en un mismo conjunto 
puede fundarse en una propiedad común o en una relación entre ellos, pero 
no tiene que ser así. El conjunto de las tres virtudes teologales es sin duda 
más interesante, pero no más legítimo, matemáticamente hablando, que aquél 
cuyos elementos son el perro de Las Meninas, el Peñón de Gibraltar y la raíz 
cuadrada de 2. La identidad de un conjunto depende total y exclusivamente 
de la identidad de sus elementos, la cual tiene que estar cabal y exactamente 
determinada para que el conjunto esté definido. Esencial es que el conjunto 
formado reuniendo determinados objetos constituya a su vez un objeto —en 
el amplio sentido indicado— y pueda, por lo tanto, entrar como elemento 
en un nuevo conjunto.? Los matemáticos distinguen, sí, entre los elementos 
contenidos en un conjunto y las partes (subconjuntos) incluidas en él. Por 
definición, x es parte de y si y sólo si todo elemento z de x es también un 
elemento de y (simbólicamente: x Cy O (ZE x> 2€ y)). Obsérvese que 
según esta definición todo conjunto es una parte de sí mismo, y C y. Si x 
C y pero x + y decimos que x es una parte propia de y (simbólicamente: x 
C y). En la conversación ordinaria no distinguiríamos con tanto celo entre 
“contener un elemento” e “incluir una parte”, pero, una vez que se lo explica, 
el distingo ciertamente parece razonable. 

Paso a describir las dos excepciones a que aludí. Consíderese un con- 
junto con, digamos, cuatro elementos, a, b, c y d. Conforme a la práctica 
usual lo llamaré el conjunto (a,b,c,d). Los conjuntos (b,c+ y (b,c,dy son 
obviamente partes de (a,b,c,d). El complemento de Lb,cj en <a,b,c,dy es 
el conjunto (a,d)j formado al quitar de <La,b,c,d) los elementos de (b,cj 
(simbólicamente: (a,b,c,ANX<b,cj = La,dy). ¿Cuál es el complemento de 


Como se puede ver, la noción matemática de conjunto nada tiene que ver con la no- 
ción lógica de clase o extensión de un concepto. Contrastando esta última con lo que 
Schróder llamó “dominio” (Gebiet) —y que corresponde casi exactamente a nuestra 
noción de “conjunto” — Frege (1895, p. 455) escribe: “Considero fallido el intento de 
basar la extensión del concepto como clase no sobre el concepto sino sobre los objetos 
individuales. [...] La extensión de un concepto no consta de los objetos que caen 
bajo el concepto, como un bosque de árboles, sino que tiene en el concepto mismo su 
único sostén (Halt). Así, el concepto tiene primacía lógica sobre su extensión.” 
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£b,c,dy en fa,b,c,dy? Para el matemático la respuesta natural es La), el 
conjunto cuyo único elemento es a. Tal respuesta desafía el uso ordinario 
del castellano, que respetábamos hasta hace un momento, cuando decíamos 
que un conjunto era una colección de objetos (así, en plural). Por otra parte, 
hablar de conjuntos de un solo elemento o conjuntos unitarios (como diré 
en lo sucesivo) no es un abuso de lenguaje muy grave y tiene la ventaja 
de permitirnos definir la complementación (esto es, la operación de tomar 
el complemento) como una 'operación algebraica? sobre el conjunto de las 
partes de un conjunto dado. 

La segunda excepción es más inquietante: la matemática contemporánea 
acepta unánimemente un objeto al que llama “conjunto” pero que no tiene 
elementos: el conjunto vacío, designado por el símbolo (J. Es evidente que, si 
(SJ existe, está incluido en todos los conjuntos (puesto que, si x es un conjunto 
cualquiera, no hay ningún elemento de W que no sea a la vez un elemento 
de x). Este resultado, en virtud del cual todos los conjuntos, por heterogé- 
neos que sean, incluyen una “parte” común, exacerba la desconfianza que 
inspira al sano sentido común la idea misma de un conjunto sin elementos. 
Me parece que el principal motivo que induce a los matemáticos a aceptar 
el conjunto vacío Y es algebraico: en presencia de (Y —y sólo gracias a 
ella— es posible conferir la estructura de un *álgebra de Boole* al conjunto 
de las partes de un conjunto cualquiera K (en adelante, PK). Consideremos 
la operación de intersección que asigna a dos conjuntos cualesquiera el con- 
junto de los elementos comunes a ambos. Volviendo a nuestro ejemplo del 
conjunto <La,b,c,dy, comprobamos que la intersección de sus partes (b,c) y 
La,c,d) es el conjunto unitario (cy, que también es una parte de fa,b,c,dy 
(simbólicamente: (b,cy A La,c,d) = (cy). ¿Cuál es, empero, la intersección 
de dos partes disjuntas de (a,b,c,d) (esto es, de dos partes que no tienen 
un elemento común)? ¿Diremos que la ecuación x = £b,cy A La,dy no tiene 
solución? ¿que la intersección no está definida sobre pares disjuntos? Eso 
es lo que diría, seguramente, cualquier persona sin educación matemática. 
Pero el matemático puede eludir esta incómoda irregularidad gracias a que 
acepta la existencia del conjunto sin elementos 4W, el cual por definición 
es parte de cualquier conjunto y constituye la intersección de cualquier par 
de conjuntos disjuntos. La matemática había dado ya pasos aparentemente 
mucho más audaces cuando aceptó la existencia de soluciones para ciertas 
ecuaciones numéricas tales como x=5-9,8x=3,x?=2,6x2+1=0. 
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Por otra parte, no se trata de conjurar la existencia de un objeto inexistente 
por un acto de hechicería intelectual.* Basta fijar cualquier objeto que no 
sea un conjunto y que por lo tanto no tenga elementos —por ejemplo, el 
Polo Sur o la ira de Aquiles— y decidir que se lo llamará “conjunto”. Con 
esta sola sencillísima convención hacemos de ese objeto una parte (vacía) 
de todo conjunto, que funciona como cero en el álgebra de Boole definible 
en el conjunto de todas las partes de un conjunto dado: Si k es una de esas 
partes, tenemos que kuUBV8B=kykNUD=9.2 

Históricamente hubo también otro motivo —aunque inválido— para acep- 
tar el conjunto vacío (WM. Para entender y apreciar este motivo hay que tener 
presente que un conjunto puede identificarse dando una lista de sus elementos 
(como hicimos con La,b,c,dy) o especificando una o más condiciones que 
satisfacen todos los miembros del conjunto y sólo ellos. Simbólicamente, el 
conjunto de todos los objetos x que cumplen una condición K se escribe “Lx: 
Kx)”. Por ejemplo, (£x:x es un número primo y x < 16) = (2,3,5,7,11,137. 
En las postrimerías del siglo XIX algunos filósofos pensaron por eso que un 
“conjunto”, en el sentido en que esta palabra empezaba a usarse en ciertas 
publicaciones matemáticas, era lisa y llanamente lo mismo que en lógica 
se conoce como la extensión de un concepto. (Evidentemente, los números 
contenidos en (2,3,5,7,11,13) constituyen la extensión del concepto “número 
primo menor que 16”). Visto de este modo, el conjunto (2 coincide con la 


Aunque algunos grandes matemáticos se han expresado como si se tratara justamente 
de eso. Así Dedekind (1888, p. 2) anuncia que en ese escrito no admitirá el conjunto 
vacío “aunque para otras investigaciones puede ser cómodo inventarlo”. (“[Wir wollen] 
das leere System, welches gar kein Element enthált, aus gewissen Griinden hier ganz 
ausschliefen, obwohl es fiir andere Untersuchungen bequem sein kann, ein solches zu 
erdichten”.) En la primera axiomatización de la teoría de los conjuntos, Ernst Zermelo 
se toma esta libertad. Postula allí el siguiente: 


Axioma IM. Hay un conjunto (impropio), el “conjunto cero” O, que no contiene 
ningún elemento. 
(Zermelo 1908a, p. 263) 


Lewis (1991) arbitrariamente define el conjunto vacío (WM como la fusión de todos los 
objetos individuales existentes (esto es, el objeto individual que comprende a todos 
los demás dentro de sí). Esta definición asegura que YD existe y está bien determinado 
como quiera que esté constituido el universo. 


George Boole introdujo el álgebra que lleva su nombre como una estructura discer- 
nible en el sistema lógico de las clases (extensiones de conceptos). Para ello tuvo 
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extensión de cualquier concepto contradictorio (Ú = (x:x + xj = (x:x es un 
cuadrado redondo), etc.). Pero, como veremos en el Capítulo 1.6, si bien 
todo conjunto identificado mediante una condición tiene como elementos 
exactamente los objetos que caen en la extensión del concepto definido por 
ella, no toda condición expresable en buen castellano identifica un conjunto. 
No puede, entonces, darse por descontado que haya un conjunto que iden- 
tifican las condiciones contradictorias. 


que completar dicho sistema, por convención terminológica, con dos “objetos” que 
normalmente no se habrían considerado como clases, a saber, el “universo” y la “clase 
sin miembros”: 


Por clase se entiende usualmente una colección de individuos, a cada uno de los 
cuales se puede aplicar un nombre o descripción particular; pero en esta obra el 
significado del término se extenderá de modo que incluya el caso en que no existe 
más que un solo individuo que responde al nombre o descripción requeridos, 
así como los casos denotados por los términos “nada” y “universo”, los cuales, 
considerados como “clases”, debe entenderse que comprenden, respectivamente, 
“ningún ente” (“no beings”) y “todos los entes”. 

(Boole 1854, p. 28) 


1.2 *CONJUNTO” (MENGE”) EN EL VOCABULARIO DE CANTOR 


Desde una perspectiva actual, podemos ver el conjuntismo en acción ya 
desde el comienzo mismo de la matemática moderna en la Geometría de 
Descartes (1637). Al caracterizar cada figura geométrica por la ecuación que 
satisfacen las coordenadas de sus puntos, la geometría cartesiana representa 
en efecto la figura mediante el conjunto de los puntos incidentes en ella, 
seleccionados de entre todos los puntos del espacio por la condición impuesta 
a sus coordenadas. Pero sólo a fines del siglo XIX y principios del XX el 
enfoque conjuntista se hará sentir con toda su fuerza gracias a la obra de 
Georg Cantor y a la influencia que ejerce sobre las siguientes generaciones 
de matemáticos. 

En el Capítulo 1.3 veremos cómo un problema clásico de la matemática 
decimonónica llevó a Cantor a considerar ciertos conjuntos de puntos de la 
recta, y de ahí a la investigación de tales conjuntos en general. Les dedica 
seis trabajos “Uber unendliche lineare Punktmannigfaltigkeiten” (“Sobre va- 
riedades lineales infinitas de puntos”) publicados en Mathematische Annalen 
entre 1879 y 1884. Ya en el tercero de ellos introduce consideraciones sobre 
“una variedad (un agregado, un conjunto) de elementos pertenecientes a 
cualquier esfera conceptual” (Cantor, GA, p. 150; citado infra), y el quinto 
versa sobre los “Fundamentos de una teoría general de las variedades”, título 
bajo el cual circula como folleto separado. Como puede verse por la frase 
recién citada, Cantor usa la palabra “conjunto” (Menge) como un sinónimo 
de lo que solía llamarse en su tiempo “variedad” o “multiplicidad” (Mannig- 
faltigkeit).* Otros sinónimos utilizados por él son Gesamtheit (“totalidad”) e 


Inbegriff (arriba traducido “agregado”). La connotación de estos vocablos se 
] La matemática alemana toma el término “Manmnigfaltigkeit” del vocabulario filosófico 
de Kant, probablemente a través de Fries. Kant llamaba así a la variedad concreta de 
los datos de los sentidos, y también a la variedad, pluralidad o multiplicidad compren- 
didas en el espacio de la geometría, por una parte, y en el tiempo de la mecánica, por 
otra. En su lección inaugural Sobre las hipótesis que están en la base de la geometría 
(1854), Riemann usa el término con la misma amplitud con que luego lo empleará 
Cantor. Riemanmn distingue entre “variedades discretas” (diskrete Mannigfaltigkeiten), 
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explica al comienzo del último trabajo que Cantor dedica al tema, “Con- 
tribuciones a la fundamentación de la teoría de los conjuntos transfinitos” 
(Cantor 1895/97): 


Unter einer “Menge” verstehen wir jede Zusammenfassung M von be- 
stimmten wohlunterschiedenen Objekten m unsrer Anschauung oder un- 
seres Denkens (welche die “Elemente” von M genannt werden) zu einem 
Ganzen. 


Entendemos por “conjunto” cualquier reunión en un todo M de determinados 
objetos bien distinguidos m de nuestra intuición o nuestro pensamiento 
(llamados “elementos” de M). 

(Cantor, GA, p. 282) 


que constan de “elementos”, y “variedades continuas” (stetige Mannigfaltigkeiten), 
que constan de “puntos”. Sin embargo, en la literatura matemática actual, el término 
alemán y sus equivalentes en otros idiomas (E. “variedad”; F. “variété”; 1. “manifold”; 
rr. “varietá”) se usan exclusivamente para referirse a objetos afines a las variedades 
continuas de Riemanmn. 

En “Fundamentos de una teoría general de las variedades”, $ 1, nota 1, Cantor había 
dicho: 


Por “variedad” (Mannigfaltigkeit) o “conjunto” (Menge) entiendo en general 
cualquier pluralidad que se deja concebir como unidad (jedes Viele, welches sich 
als Eines denken láft), es decir, cualquier agregado (Inbegriff) de elementos de- 
terminados que en virtud de una ley pueden ser combinados en un todo. 
(Cantor, GA, p. 204) 


Bernhard Bolzano había utilizado el término “Menge” en una acepción similar en su 
obra póstuma Paradojas del Infinito (1851): 


Einen Inbegriff, den wir einem [ .. . ] Begriffe unterstellen, bei dem die Anordnung 
seiner Teile gleichgiiltig ist [... ], nenne ich eine Menge. 


Llamo conjunto a un agregado subordinado a un concepto, cuando no importa el 
orden de sus partes. 


(Bolzano 1964, p. 4) 


El concepto que gobierna la formación de un conjunto en el sentido de Bolzano puede 
equipararse a la ley que según Cantor preside la combinación de los elementos del 
conjunto en un todo. Es significativo que en sus caracterizaciones más tardías de la 
noción de conjunto Cantor no haga alusión a la existencia de una ley tal. Veo aquí 
una evolución comparable a la del concepto matemático de función de d”Alembert a 
Dirichlet (esbozada al comienzo del Capítulo 1.3). 
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La frase “reunión en un todo” expresa, me parece, que un conjunto es él 
mismo un objeto, “concebido como una cosa de por sí”, como dice Cantor 
en un pasaje paralelo (Cantor, GA, p. 411). La indicación de que consta de 
objetos de “nuestra intuición o nuestro pensamiento” no debe interpretarse 
como una restricción encaminada a subordinar la noción de conjunto al 
alcance de nuestras facultades mentales. Se dirige más bien a subrayar que 
la índole variopinta de los objetos reunidos en un conjunto en nada afecta 
su viabilidad. En el citado pasaje paralelo expresa la misma idea diciendo 
que dichos objetos pueden ser “cosas concretas o conceptos abstractos”. 
Estas dos categorías ontológicas presumiblemente agotaban el reino de lo 
posible a ojos de Cantor. Ahora bien, “intuición” y “pensamiento” son las 
facultades cognitivas tradicionalmente asociadas por la filosofía alemana a 
lo concreto y lo abstracto. Por otra parte, es esencial que los elementos de 
un conjunto estén exactamente determinados y no se confundan entre ellos, 
ni con otras cosas que no son elementos del conjunto. En el pasaje arriba 
aludido del tercer trabajo sobre las variedades lineales infinitas de puntos, 
esto se traducía en la exigencia de que los conjuntos bajo consideración 
estuviesen “bien definidos” (wohldefiniert): 


Llamo bien definida una variedad (una totalidad, un conjunto) de ele- 
mentos pertenecientes a cualquier esfera conceptual si sobre la base de su 
definición y como consecuencia del principio lógico del tercero excluido 
hay que considerar internamente determinado, por una parte, si un objeto 
cualquiera de la misma esfera conceptual pertenece o no como elemento 
a dicha variedad, y, por otra, si dos objetos pertenecientes al conjunto, 
no obstante diferencias formales en el modo como son dados, son o no 
iguales entre sí. 

(Cantor, GA, p. 150). 


Cantor agrega que la decisión acerca de si un objeto dado a pertenece o 
no a un conjunto bien definido M, o es o no idéntico a un objeto dado b 
“generalmente no puede efectuarse con seguridad y precisión mediante los 
métodos y aptitudes disponibles”. Pero lo que importa no es esto, sino “sólo 
la determinación interna, que en casos concretos, cuando los fines buscados 
lo requieran, se articulará, perfeccionando los medios auxiliares, como una 
determinación efectiva (externa).” Cantor nada dice sobre los medios auxi- 
liares que permiten articular la determinación efectiva de los elementos de 
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un conjunto bien definido; pero supongo que en todo caso serán variantes 
de los dos que mencioné al final del Capítulo 1.1: o bien se da una lista de 
todos los elementos del conjunto, nombrando o describiendo a cada uno de 
una manera inequívoca; o bien se establece una condición que cumplen todos 
los elementos del conjunto y sólo ellos y un procedimiento para decidir si un 
objeto cualquiera satisface o no dicha condición. El requisito de “determina- 
ción interna” podría entonces suponerse cumplido con sólo prescribir tal con- 
dición, aunque no se conozca el procedimiento de decisión correspondiente. 
La caracterización de “conjunto” que trascribí de las “Contribuciones” (GA, 
p. 282) significa, a mi modo de ver, que la teoría general de los conjuntos 
concierne solamente a conjuntos bien definidos, en este sentido. 

En suma, un conjunto en el sentido de Cantor es un objeto constituido 
por otros objetos —los elementos del conjunto— de tal modo que su iden- 
tidad depende de la determinación precisa de cuáles objetos son elementos 
suyos y cuáles no.? Esta noción de conjunto concuerda en lo esencial con la 
expuesta en el Capitulo 1.1. De hecho, a pesar de su explícita insistencia en 
que los conjuntos constan de “elementos bien distinguidos”, Cantor se refiere 
ocasionalmente a un conjunto que consiste de un solo elemento (GA, p. 98). 
En cambio, su postura con respecto al conjunto vacío es menos clara. En 
el N* 1 de la serie “Sobre variedades lineales infinitas de puntos” dice que 
“conviene tener un símbolo que exprese la ausencia de puntos, para lo cual 
elegimos la letra O. P = O significa entonces que el conjunto de puntos P 
no contiene ni un solo punto, o sea que, estrictamente hablando, no existe 
como tal” (GA, p. 146). Así, pues, al mismo tiempo que niega la existencia 
del conjunto vacío, Cantor le pone un nombre, lo cual es quizás la vía más 


La misma noción de conjunto es adoptada por Dedekind en el influyente ensayo que 
dedica por esos años a la fundamentación conjuntista de la aritmética (aunque Dedekind 
dice “sistema” —*System'— en vez de “conjunto” —“Menge”): 


Ocurre muy a menudo que diversas cosas a, b, c... por algún motivo son con- 
cebidas bajo un punto de vista común y reunidas en la mente. Se dice entonces 
que forman un sistema S. [... ] Como objeto de nuestro pensamiento, tal sistema 
S (o sea una colección, o una variedad, o una totalidad [oder ein Inbegriff, oder 
Mannigfaltigkeit, oder Gesamtheit]) también es una cosa; está completamente 
determinado, cuando está determinado respecto de cada cosa si es o no un ele- 
mento de S. 

(Dedekind 1888, pp. 1s.) 
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segura —en matemáticas como en literatura— para darle realidad a una fic- 
ción. En el N* 6 de la misma serie da un paso más hacia el reconocimiento 
del conjunto (2. Cantor considera allí un conjunto de puntos P incluido en 
una región A de un espacio n-dimensional G. Si A se descompone en un 
número finito o infinito de regiones conexas disjuntas H,, H,,... Hy..., 
P también se divide en “un número correspondiente” de partes disjuntas P,, 
Pa... Py..., donde P,=H,NP (v=1,2,...). Cantor comenta que 
“P, puede, entonces, ser igual a cero (Null), en caso de que ningún punto 
de P caiga dentro de la región H,” (GA, p. 210). Cantor no dice que el cero 
que aquí se nombra sea un conjunto, pero lo ve sin duda como un objeto 
por derecho propio, y además lo equipara a una parte de un conjunto. El 
lector advertirá que el Y se presenta aquí justamente como la intersección 
de dos conjuntos disjuntos. El pasaje sugiere, además, que la letra O se le 
impuso a Cantor como símbolo cuando escribía el N*1 por su parecido con 
el número 0. 


1.3 SERIES TRIGONOMÉTRICAS 


El problema matemático que lleva a Cantor a ocuparse con determinados 
conjuntos de puntos de la recta concierne a la representación de funciones 
reales mediante series trigonométricas. Una función real es una aplicación* 
cuyos argumentos y valores son números reales. Las definiciones modernas 
de número real datan de la época de Cantor, y como él mismo fue el autor 
de una de ellas, es de suponer que no le contentaron las anteriores. Luego 
bosquejaré la teoría de los números reales de Cantor. Entre tanto, para no 
pecar de excesivo anacronismo, entenderemos que una función real es una 
correspondencia f entre las distancias (orientadas) determinables en dos rectas 
A, y A, en que se ha marcado un punto O y un punto a distancia +1 del O. 
Diremos que tales rectas han sido parametrizadas. f asigna a cada distancia 
x medida desde el O en la recta parametrizada A, una distancia y = f(x) me- 
dida desde el O en A4,. Como hay un y sólo un punto sobre cada recta a una 
dada distancia (orientada) del respectivo O, f se concibe naturalmente como 
una correspondencia entre puntos, una aplicación del conjunto de los puntos 
situados en A, en el conjunto de los puntos situados en A;,. (La función f 
puede también estar definida sólo sobre una parte propia —por ejemplo, un 
intervalo— de la recta A,.) 

Aunque los matemáticos anteriores a Cantor no se expresaban en estos 
términos, es difícil eludir la impresión de que pensaban de esta manera. En 
el siglo XVIII, algunos autores, como d*Alembert, entienden al parecer que 
una función real f tiene que definirse mediante operaciones algebraicas sobre 
la “variable independiente” x (y constantes); mientras que otros, más atentos 
a las aplicaciones físicas, piensan que ella puede ser cualquier correspon- 
dencia x > f(x) que represente una curva plana arbitraria (conforme a la 
convención habitual que mide los argumentos x sobre el eje horizontal de 
las abscisas y los valores y = f(x) sobre el eje vertical de las ordenadas). 
Estas dos nociones —algebraica y geométrica— de una función real son 
demasiado estrechas en comparación con la idea generalizada de función 
que Dirichlet introduce en 1837: 
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Sean a y b dos valores fijos y sea x una cantidad variable tal que x 
toma paulatinamente todos los valores entre a y b. Si un único y finito 
corresponde a cada x de modo que, mientras x recorre continuamente el 
intervalo desde a hasta b, y = f(x) también varía gradualmente, se dice 
que y es una función continua o regular de x sobre este intervalo. No es 
necesario que y esté sujeta a la misma regla con respecto a x a través de 
todo el intervalo. Ni siquiera es necesario que la relación pueda expresarse 
mediante operaciones matemáticas.! 


Dirichlet admite además que la variación paulatina concomitante de x y f(x) 
se interrumpa para uno o más valores de x. En otras palabras, f puede tener 
una o más discontinuidades. La matemática posterior fue aún más liberal: 
la continuidad, interrumpida o no, no es un rasgo esencial del concepto de 
función. 

Es de suponer que Joseph Fourier partía de la idea geométrica de función 
cuando anunció en 1807 que cualquier función f definida en un intervalo 
finito de la recta real —digamos, en [-1r, T] — puede representarse mediante 
una serie trigonométrica de este modo: 


00 


fQ)= 2 + Y (a, cosnx +b, sennx) 


n=1 


(1) 


donde los coeficientes a, (para n > 0) y b, (para n > 1) están dados por: 


l pz 
a, = al f(x) cosnxdx o 


l pz 
e J” fG0sennxdx E 


Fourier demostró su tesis para algunos casos especiales y esbozó, con escaso 
rigor, una demostración general.? Años más tarde, Dirichlet, en el escrito 


l Dirichlet, “Uber die Darstellung ganz willkiirlicher Functionen durch Sinus und Cosinus- 
reihen”, Repertorium der Physik, Berlin: Veit, 1837, vol. IL, p. 152; citado por Mannheim 
1964, pp. 52s. 


Fourier, Théorie analytique de la chaleur (1822). 
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arriba citado, estableció ciertas condiciones suficientes para que una función 
f pueda representarse de este modo y Riemann, en su Habilitationschrift de 
1854, intentó establecer condiciones necesarias. En este trabajo, Riemann dio 
la definición de integral que todavía sirve de base a la enseñanza elemental 
del cálculo y demostró varios resultados importantes. Pero la cuestión de 
las condiciones necesarias y suficientes de la representación (1) quedó —y 
sigue— pendiente. 

Aunque no se sepan exactamente las condiciones en que una función 
real admite la representación (1), es importante saber si esa representación 
es única, cuando existe, o si, por el contrario, una misma función puede 
representarse mediante dos o más series trigonómetricas diferentes. Esta 
es la cuestión que Cantor abordó y resolvió en varios artículos publicados 
entre 1870 y 1872.* Cantor (1870) considera una función real f definida en 
un intervalo finito I y representable mediante una serie trigonométrica de la 
forma (1), convergente para todo x e I. No presupone que f sea integrable 
o que los coeficientes de la serie (1) estén dados por (2) y (3). Tampoco 
requiere la convergencia uniforme de la serie (1) en L* La unicidad de la 
representación (1) es un corolario del siguiente teorema: 


[T1] La serie trigonométrica en el lado derecho de la ecuación (1) repre- 
senta la función constante f(x) = 0 si y sólo si a, = b, = 0 para 
todo número no negativo n. 


En efecto, si hay dos representaciones de una misma función g mediante 
series de la forma (1), la diferencia de las dos series, tomada término a 
término, representa la función f(x) = O. Pero esto supone, según el teorema 
citado, que la diferencia entre coeficientes homólogos de ambas series sea en 


Los trabajos de Cantor aludidos a continuación —como todos sus escritos más impor- 
tantes— han sido resumidos en inglés por Dauben (1979), pero en esta parte, como en 
otras, la exposición de Dauben tiene mucho que envidiarle a la claridad del original. 
J. Marshall Ash (1989) ofrece una demostración rigurosa y detallada de los resultados 
de Cantor (1870). 


Decimos que la serie e f,(x) converge uniformemente al límite f(x) en el intervalo 
L si para cada número real positivo e hay un entero positivo N(g) tal que, para todo 


x e l y todo n> M8), If()- Y f (1 <e. 
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cada caso igual a O o, en otras palabras, que las dos representaciones sean 
idénticas. El teorema T1 se deduce fácilmente del siguiente resultado, que 
Cantor demuestra utilizando un ingenioso artificio aprendido de Riemann: 


[T2] Si para todo x en el intervalo finito I, 
lim(a,sen nx + b, cos nx) =0 (4) 


entonces, lima, =0 y limb,=0. 
n>o > 

En trabajos posteriores Cantor simplifica la demostración de esta proposi- 
ción conforme a una sugerencia que le hizo Kronecker y establece que ella 
sigue siendo válida aunque haya valores excepcionales de x para los cuales 
la secuencia (4) no converge en absoluto o converge a un límite distinto de 
0. Es justamente a este propósito que presta atención a ciertos conjuntos de 
puntos en el intervalo I, a fin de determinar con precisión el conjunto de 
esos valores excepcionales. Cantor (1871) demuestra T2 —y por lo tanto 
la unicidad de la representación (1) — para el caso de que haya un número 
arbitrariamente grande pero finito de valores excepcionales de x en cualquier 
intervalo finito dado. Cantor (1872) extiende las demostraciones anteriores a 
una familia de casos en que el intervalo finito I incluye un subconjunto infi- 
nito de puntos x donde la secuencia (4) no converge o converge a un límite 
diferente de O. En dicho trabajo —y al servicio de ese resultado— Cantor 
introduce su teoría de los números reales —que llama *magnitudes numéricas” 
(Zahlengrófen)— y hace sus primeras consideraciones sobre conjuntos de 
puntos. Paso a explicarlas. 

Cantor dice que “los números racionales constituyen el fundamento para 
la determinación del concepto más amplio de magnitud numérica”. Los 
racionales forman “el dominio A” (Cantor, GA, p. 92). Sea ay, a,,... una 
secuencia infinita de racionales, tal que para cada número racional e > 0 
hay un entero positivo N, de suerte que la,, — a,| < e siempre que N < m 
< n. Diremos que a,, a,,... es una secuencia fundamental en el dominio 
A, y la designaremos (a;). (En vez de “secuencia fundamental” suele decirse 
“secuencia de Cauchy”.) Cantor asocia a cada secuencia fundamental en A 
un índice sujeto a la condición siguiente: Si (a) y (b;) son dos secuencias 
fundamentales en A y para cada número racional e > 0 hay un entero positivo 
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N tal que la, — b,| < € sí N< n, se asocia un mismo índice a las secuencias 
(a) y (b;). Diremos en tal caso que (a,) y (b;,) son secuencias equivalentes.* 
Si (a;) y (b,) son dos secuencias fundamentales en A asociadas a dos índices 
diferentes O. y B, decimos que o. < $ si hay un número racional positivo 
q y un entero positivo N tales que q < (b, — a,) si N < n. Cantor llama 
B al dominio formado por los índices de las secuencias fundamentales de 
racionales. Claramente, la relación < establece un orden lineal en B. Cantor 
define asimismo la adición y la multiplicación en B: 


ADICIÓN: Sean Ql y B los índices asociados respectivamente a las secuencias 
(a) y (b;). Entonces, la suma o. + B es el índice correspondiente a la se- 
cuencia (a; + b;), formada sumando esas dos secuencias término a término. 


MULTIPLICACIÓN: Sean O. y B los índices asociados respectivamente a las se- 
cuencias (a;) y (b;). Entonces, el producto aKf es el índice correspondiente 
a la secuencia (a;b;), formada multiplicando esas dos secuencias término a 
término. 


En virtud de estas definiciones, los objetos que forman el dominio B merecen 
llamarse “magnitudes numéricas”. Las operaciones así definidas confieren a 
B la estructura de un cuerpo* ordenado (aunque Cantor no se expresa así). 
Su próximo paso consiste en formar secuencias fundamentales con elementos 
tomados de A y B. Ahora bien, el concepto de secuencia fundamental ex- 
plicado arriba puede sin duda extenderse al dominio B utilizando la adición 
y el orden definidos en éste; pero sería preferible evitar la promiscuidad 
entre A y B. Esto se logra reemplazando cada elemento a de A incluido en 


Como fácilmente se puede comprobar, la relación entre (a) y (b;) es una genuina 
relación de equivalencia, puesto que es una relación simétrica, transitiva y reflexiva. 
Cabe, pues, entender que el índice asociado a cada secuencia fundamental no es otra 
cosa que la clase de equivalencia a la que pertenece en virtud de esta relación. 


La adición determina el O en B, a saber, aquel objeto cuya suma con cualquier otro es 
igual a este último. Los demás objetos de B quedan entonces clasificados en positivos y 
negativos, según sean mayores o menores que el O. Si A: y P están en B, 0. — $ designa 
la suma de Q: y el único objeto de B cuya suma con f es igual a O. Una secuencia 
fundamental en B puede entonces definirse en los mismos términos utilizados arriba 
para definir una secuencia fundamental en A, con una sola diferencia: e > O debe ser 
un objeto de B, no de A. 
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una secuencia promiscua por el elemento de B correspondiente a la secuen- 
cia constante (a, a,...) — esto es, a la secuencia (a,) tal que a, = a para 
cada entero positivo k. Mediante un procedimiento análogo al seguido para 
formar el dominio B, Cantor forma un dominio C de índices asociados a 
las secuencias fundamentales en B, un dominio D de índices asociados a las 
secuencias fundamentales en C, etc. La equivalencia de secuencias funda- 
mentales, así como el orden, la adición y la multiplicación de los índices 
pertinentes se definen en cada nuevo dominio de una manera similar a la 
indicada en la construcción de B. 

Es claro que el dominio B, aunque dotado de una estructura algebraica pa- 
recida a la de A, es esencialmente más rico que éste. En efecto, si bien cada 
elemento de A corresponde, del modo explicado, a un elemento único de B, 
hay elementos de B que no corresponden de este modo a ningún elemento 
de A. Por ejemplo, si (a;) es una secuencia en A tal que la secuencia de 
productos (aa) es equivalente a la secuencia constante (2, 2,...), no hay 
un número racional q tal que (a,) sea equivalente a la secuencia constante (q, 
q, - . . ) y por lo tanto el índice de la secuencia (a;) no corresponde del modo 
antedicho a ningún elemento de A. En cambio, toda secuencia fundamental 
(0.,) de elementos de B equivale a alguna secuencia constante (Q, AL, ... ) en 
B, y otro tanto puede decirse de las secuencias fundamentales en C, D, etc. 
Por esta razón, los dominios C, D,... son todos estructuralmente idénticos 
a B. Sea K uno cualquiera de estos dominios. Entonces hay una aplicación 
biyectiva única de B en K que respeta la relación < y todas las relaciones 
determinadas por la adición y la multiplicación.” Dicha aplicación es lo que 
se llama un isomorfismo* (porque retrata fielmente una estructura en la otra) 
canónico (porque es único en su género). Salvo una particular afición a la 
recurrencia infinita, no veo qué pueda haber inducido a Cantor a reconocer 
los dominios C, D,... como diferentes de B. 

Por último, Cantor coordina los elementos del dominio B con los puntos 
de una recta (parametrizada) cualquiera. Recuerda que, una vez que se ha 
fijado el punto O, las direcciones positiva y negativa desde el O y la unidad 
de distancia, cada punto p queda perfectamente individualizado por su dis- 


; Sea q: B > K la aplicación en cuestión. Entonces, para cada Qt, P e B, (a) < p(B) 


si y sólo si a. < PB; p(a + B) = p(a) + p(B), y p(aB) = plo) p(B). En particular, p(0) 
es el O de K y Q(1) es el 1 de K. 
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tancia (orientada) al punto O. Si esa distancia es un número racional a, el 
punto p queda asociado unívocamente a ese elemento de A. (Y también, por 
ende, al elemento único de B que es el índice de la secuencia constante (a, 
a,...)). Pero si la distancia orientada de p al O no es un número racional, 
siempre habrá una secuencia fundamental de racionales (a,) tal que (1) para 
cada entero positivo k hay un punto p;, a distancia a, del O, y (11) todo in- 
tervalo centrado en p, por pequeño que sea, encierra infinitos puntos de la 
secuencia (p,). Cantor resume esto diciendo que la distancia de p al punto O 
es igual a b, donde b es el índice de la secuencia (a,). De este modo, a cada 
punto de la recta corresponde una y sólo una “magnitud numérica” en B. 
Cantor reconoce que no es posible demostrar que exista la correspondencia 
inversa, en virtud de la cual “a cada magnitud numérica le pertenece un 
determinado punto de la recta, cuya coordenada es igual a esa magnitud nu- 
mérica, en el sentido aquí explicado”. Por eso la acepta simplemente como 
“axioma”. En virtud de este axioma, “las magnitudes numéricas obtienen una 
cierta objetividad, de la cual, sin embargo, son enteramente independientes” 
(Cantor, GA, p. 97). 

Establecida así —por decreto— la correspondencia entre las “magnitudes 
numéricas” (números reales) y los puntos de la recta, Cantor advierte que 
en lo sucesivo cuando hable de puntos se referirá a las magnitudes numéri- 
cas correspondientes. En aras de la brevedad llamará “conjunto de valores” 
(Wertmenge) a una multitud dada de tales magnitudes, y “conjunto de puntos” 
(Punktmenge) a la correspondiente multitud de puntos. Si P es un conjunto 
cualquiera de puntos contenidos en un intervalo finito, P determina otros 
conjuntos de puntos, que Cantor llama “conjuntos derivados” (abgeleitete 
Punktmengen). Se definen así. Un entorno de un punto p es un intervalo que 
contiene a p. Si cada entorno de p contiene infinitos puntos del conjunto P, 
diremos que p es un punto límite (Grenzpunkt — también se dice “punto de 
acumulación”) de P. El primer conjunto derivado P” es el conjunto de todos 
los puntos límite del conjunto P. El (v+1)-ésimo conjunto derivado PW*D es 
el conjunto de todos los puntos límite del v-ésimo conjunto derivado P(”. Por 


Sea dicho de paso, aquí tenemos un ejemplo de conjunto unitario, propuesto por 
Cantor mismo. El texto, traducido, dice así: “Si el conjunto P consiste de los puntos 
correspondientes a las abscisas 1, 1/2, 1/3,....,1/n,... el conjunto P“ consiste del solo 
punto O y no tiene un conjunto derivado.” (Cantor, GA, p. 98). 
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ejemplo, si P es el conjunto de puntos a distancia 1, 1/2, 1/3, 1/4,... del 
O, el primer conjunto derivado P” es el conjunto (07.5 Evidentemente, si el 
v-ésimo conjunto derivado P(” de un conjunto de puntos P contiene sólo un 
número finito de puntos, su (v+1)-ésimo conjunto derivado P*D no contiene 
ninguno. Hoy diríamos que en tal caso P+D = Y, pero lo que dice Cantor es 
que si P contiene sólo un número finito de puntos, entonces PY no tiene 
conjunto derivado. El conjunto original P es entonces lo que Cantor llama 
un “conjunto de puntos de la v-ésima especie” (Punktmenge v'*” Art). 

Recurriendo a estos conceptos, Cantor demuestra que la proposición T2 
sigue siendo válida aunque sus condiciones no se cumplan en un conjunto de 
puntos de la v-ésima especie incluido en el intervalo I, cualquiera que sea el 
entero positivo v (siempre, claro está, que esas condiciones estén satisfechas 
en el resto de ID). Ello implica el siguiente teorema sobre la unicidad de la 
representación (1): 


Si la serie trigonométrica 


f=% + Y (a, cosnx+b,sennx) 


n=1 


representa a la función real f en todos los puntos x del conjunto IMP, 
donde I es un intervalo finito de la recta real y P € I es un conjunto de 
puntos tal que su conjunto derivado P“” = Y para algún entero positivo 
n, entonces dicha representación es única. 


1.4 DIVERSOS INFINITOS 


Como veremos en el Capítulo 1.5, con sus reflexiones sobre los conjuntos 
derivados Cantor dio un primer paso decisivo para la construcción de la 
aritmética del infinito expuesta en los trabajos “Sobre variedades lineales 
infinitas de puntos” de 1879-1884. Pero antes explicaré ciertos hallazgos 
sobre conjuntos infinitos que Cantor publicó en 1874 y 1878 y que contri- 
buyeron poderosamente a motivar sus estudios posteriores. Se refieren a lo 
que Cantor llama la “potencia” (Máchtigkeit), esto es, la numerosidad de 
un conjunto, que es la única propiedad que lo caracteriza si se hace caso 
omiso de su estructura y de la naturaleza de sus miembros.! Decimos que 
dos conjuntos a y b son equinumerosos, o que tienen la misma potencia, si 
hay una aplicaciónt biyectiva de a sobre b. En cambio, si hay una aplica- 
ción inyectiva de a en b, pero no hay una aplicación biyectiva de a sobre 
b, diremos que b es más numeroso que a, o que su potencia es mayor que 
la de a. Evidentemente, estas definiciones prescinden de la índole de a y b, 
y de sus respectivos elementos. Utilizando estos conceptos, Cantor (1874) 
demuestra las proposiciones siguientes: 


Tras explicar con admirable claridad y concisión la médula de las investigaciones de 
Cantor sobre la representación única de funciones reales mediante series trigonométricas, 
Maddy indica sugestivamente de qué modo el descubrimiento del teorema enunciado al 
final del Capitulo 1.3 pudo conducirle a reflexionar sobre la numerosidad de los conjun- 
tos infinitos. Una vez que definió los reales en términos de secuencias fundamentales, 
Cantor pudo extender su teorema de unicidad de 1870 a funciones que convergen sólo 
en el complemento de un conjunto infinito, aunque excepcional, de puntos. 


Pero ¡qué curioso conjunto de puntos era éste! Finito y bastante complejo, y 
sin embargo en cierto modo tan pequeño o tan bien portado con respecto a la 
totalidad de los reales, que resultaba inofensivo. Al parecer, esto puso a Cantor 
a pensar de cómo era que los conjuntos continuos, tales como los reales, se re- 
lacionan con conjuntos infinitos discretos y al parecer más pequeños, tales como 
los números naturales. 

(Maddy 1990, p. 108) 
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(09) El conjunto de todos los números algebraicos y el conjunto de los 
enteros positivos (1, 2,...) son equinumerosos. 

(19) El conjunto de los números reales comprendidos en un intervalo 
finito cualquiera es más numeroso que el conjunto de los enteros 
positivos. 


Cantor (1878) demuestra que: 


(ID El conjunto de los puntos contenidos en un segmento recto es equi- 
numeroso con el conjunto de los puntos contenidos en un cuadrado 
o en un cubo o, en general, en cualquier hipercubo de dimensión 
arbitraria n. 


Se llama número algebraico a cualquier número real que sea una solución 
de una ecuación con coeficientes enteros, de la forma: 


O) + 0x+ 012+..+ 0,1=0 (1) 


El índice más alto para el cual 0, + O se llama el grado de la ecuación (1). 
Una ecuación de grado n admite a lo sumo n soluciones reales. Para que cada 
solución corresponda a una sola ecuación de la forma (1), Cantor requiere 
además que 0, sea positivo y que todos los coeficientes sean primos entre 
sí (es decir, que no tengan un divisor común). Digamos que una ecuación 
que reúne estas características es una ecuación simplificada. Cantor asigna a 
cada número algebraico un entero positivo que llama su altura (Hóhe) y que 
determina así: Sea u una solución de una ecuación simplificada de grado n 
con coeficientes Oy, O, ..., O, Entonces la altura de u es igual a n— 1 + 
lotp! + lar¡l +... + lor. Se comprueba fácilmente que no hay más que una 
cantidad finita de números algebraicos de una misma altura. Cantor observa 
que hay sólo uno con altura 1, dos con altura 2, cuatro con altura 3. Digamos 
que el número algebraico u precede al número algebraico v si u tiene menor 
altura que v, o, en el caso de que tengan la misma altura, si u es menor que 
v. Evidentemente, los números algebraicos ordenados de esta manera forman 
una secuencia infinita, 4;, u>,..., en correspondencia biunívoca con los 
enteros positivos. Este resultado llama la atención, ya que en cada entorno 
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de cualquier número real p hay infinitos números algebraicos. 

Para probar que todo intervalo real (ot, B) es más numeroso que el conjunto 
de los enteros positivos, Cantor considera una secuencia infinita arbitraria O 
de números reales, todos diferentes, p;, P»,- . - , y muestra que en cualquier 
intervalo (a, B) hay por lo menos un número real que no pertenece a esa se- 
cuencia. Esto significa que ninguna aplicación inyectiva del conjunto de los 
enteros positivos en el conjunto de los reales cubre todo el intervalo (a, B). 
Vamos a recorrer en orden la secuencia O hasta encontrar dos números conte- 
nidos en (0, B). Desígnemoslos QA, y B;, de tal modo que 0, < B,. (Notamos 
que si no hubiera más que un número p, en O contenido en (o, KB), cualquier 
elemento del interior de (oz, p,) sería un número real que no pertenece a 0). 
Sigamos recorriendo la secuencia O, hasta hallar dos números contenidos en 
el intervalo (0,,B,). Llamémoslos a, y B,, de modo que aL, < B,. Esta opera- 
ción se repetirá tantas veces como dé un resultado, designándose, en general, 
con QL,,, y B,,, a los dos primeros miembros de la secuencia O contenidos 
en el intervalo (0, B,) y tales que 02, < B,,,¡. Hay dos posibilidades: o bien 
(P1) hay un entero positivo k tal que el interior de (0.,, B,) no contiene dos 
números de O, en cuyo caso ninguno de los infinitos números reales mayores 
que ot, y menores que f, pertenece a O; o bien (P2), no importa cuán grande 
sea k, el intervalo (0, P,) siempre contiene por lo menos dos números de 
G, en cuyo caso la secuencia infinita creciente 0%;, 0L,,..., acotada arriba 
por los B,, converge a un límite (ac*, y la secuencia infinita decreciente Bf, 
B,, - . . , acotada abajo por los 0t,, converge a un límite B*. Si aí* < B*, cual- 
quier número contenido en el intervalo (a*, $B*) es un número real que no 
pertenece a O. Si a1* = B*, entonces 04* no pertenece a O, puesto que, si 01* 
perteneciera a O, tendríamos que Q* = p, para cierto entero positivo r y las 
secuencias 0;, O,, ... y Bi, B,,.. . son subsecuencias de O definidas de tal 
modo que p, no puede estar contenido en el intervalo (oz, B,) (en el mejor 
de los casos, (0.,,B,) = fp¡,p>) y el primer miembro de O que puede estar 
contenido en (0;,B,) es p3); en cambio, 0* está contenido en (0,, B,), cual- 
quiera que sea el entero positivo r. Por lo tanto, existe al menos un número 
real en el intervalo (0, $B) que no pertenece a la secuencia O. 

Cantor (1874) habla de los enteros positivos, de los números algebraicos 
y de los números reales en cierto intervalo finito como si cada una de estas 
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clases infinitas de números estuviera presente en su totalidad.? El supuesto 
de que la investigación matemática se ocupa con conjuntos bien definidos 
que constan de infinitos elementos está, por cierto, implícito ya en su teoría 
de los números reales, según la cual cada uno de estos corresponde a una 
secuencia fundamental infinita bien definida de números racionales; o, para 
ser más exacto, a una clase infinita de tales secuencias.? Este supuesto es 
contrario a la concepción tradicional, heredada de Aristóteles, según la cual 
la infinitud de los números y otras clases de objetos matemáticos —que se 
manifiesta en la posibilidad de producir otros nuevos, interminablemente, cada 
vez que se ha fijado una cierta cantidad de ellos— excluye el que pueda 
concebírselos como formando una totalidad acabada. Más adelante veremos 
como Cantor defiende en sus escritos filosóficos la actualidad del infinito 
matemático, contra esta idea aristotélica de un infinito meramente potencial. 
Pero conviene examinar desde ya en qué medida la concepción cantoriana 
del infinito afecta no sólo el enunciado sino también la demostración de las 
proposiciones l y II. 

Pienso que la demostración de la proposición 1 no presupone un infinito 
actual. Cantor propone un método para enumerar los números algebraicos 
de modo que ninguno se omita. Para ello no es menester que los enteros 
positivos formen una totalidad dada de antemano. Basta irlos tomando en 
orden, uno a uno, de una fuente virtualmente inagotable, y asignarlos a los 
números algebraicos conforme a una regla que asegure que ninguno de éstos 
será pasado por alto. Esto es lo que se logra con el método propuesto. Su- 
pongamos que cuando enumeramos cierto número a cierto número algebraico 
b no ha sido enumerado todavía. En tal caso, o bien b tiene mayor altura 
que a, o, si tiene la misma altura, es simplemente mayor que a. En ambos 
casos, le corresponde ser enumerado después que a y, por consiguiente, 


Cantor, GA, pp. 115, 116, menciona expresamente “der Inbegriff aller ganzen positi- 
ven Zahlen”, “die reellen algebraischen Zahlen in ihrer Gesamtheit” y “die sámtlichen 
reellen Zahlen, welche > O und < 1 sind”. 


Adviértase que si G es una secuencia fundamental y se modifican de cualquier manera 
los n primeros términos de G, donde n es un entero determinado, tan grande como se 
desee, se obtiene una secuencia fundamental o” equivalente a O. Así, la identidad de 
cada número real, según la teoría de Cantor, depende de la última parte —infinita— de 
la secuencia fundamental que lo representa (esto es, de lo que resta de la secuencia 
después de remover los n primeros términos, para n fijo, pero arbitrario). 
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su ausencia de entre los números algebraicos enumerados antes que a no 
constituye una omisión. 

En cambio, parece que la demostración de la proposición ll depende esen- 
cialmente de que el conjunto de los enteros positivos esté ya dado. Se trata 
de mostrar que, como quiera que este conjunto se inyecte en el dominio de 
los reales, la imagen de la inyección excluye por lo menos un número real 
de un determinado intervalo.* Para probar la proposición II Cantor considera, 
como vimos, una inyección cualquiera GO, cuya imagen realiza una de las 
alternativas que arriba llamé P1 y P2. Ahora bien, sólo se puede decidir que 
estamos frente a la alternativa P1 si hemos recorrido todos los valores de 
GO. De otro modo ¿cómo se podría establecer que a lo sumo hay sólo uno 
de esos valores dentro de cierto intervalo (0, P,), determinado como se 
explicó? Sin embargo, sería errado creer que la prueba de la proposición II 
requiere que se sepa cuál de las dos alternativas se cumple. Sólo hace falta 
saber que, cualquiera que sea la aplicación inyectiva G de los enteros posi- 
tivos en los reales, tiene que cumplirse una de las dos. La argumentación de 
Cantor va dirigida a mostrar que, en ambos casos, hay dentro del intervalo 
(oL, B) por lo menos un número real que no es un valor de 6. Como P1 es 
la negación de P2, el principio lógico del “tercero excluido” implica que 
una tercera alternativa es imposible.* (Según L. E. J. Brouwer, la matemática 
cantoriana es inaceptable justamente porque dicho principio lógico no vale 
en los dominios infinitos; cf. Apéndice XIX). 

La demostración de la proposición III publicada por Cantor en 1878 es 
demasiado larga para reproducirla aquí.? Pero una carta suya a Dedekind de 
1877 contiene otra demostración más sencilla que voy a parafrasear. Inyec- 
taremos el interior de un cuadrado O en el interior de un segmento S. Con 
este propósito le asignamos a cada punto en éste último un número real x 


Si el conjunto de los enteros positivos existe, no cabe duda de que hay por lo menos 
una aplicación inyectiva del mismo en el dominio de los reales, a saber, la inclusión 
canónica que asigna a cada entero positivo z el número real correspondiente a la se- 
cuencia constante (Z, z,....). 

P1 se cumple si para todo entero positivo k hay dos valores de la secuencia O en el 
intervalo (0, B,). P2 se cumple si hay un entero positivo k tal que en el intervalo 
(Ot, P,) no hay dos valores de O. 

El texto alemán original aparece en Cantor, GA, pp. 119-133. Dauben 1979, pp. 58-66, 
da una buena paráfrasis en inglés. 
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en el intervalo (0,1) y a cada punto en Q un par de coordenadas (y,z) del 
mismo intervalo. Cualquier número de ese intervalo puede expresarse de 
una sola manera como un decimal infinito 0,0,0.,0z ..., donde cada al, es 
un dígito y para cada entero positivo k hay otro entero h tal que 0.,,, > 0. 
Algunos de esos números pueden además representarse mediante decimales 
finitos —por ejemplo, 0,273999 ... =0,274— pero excluiremos esta forma 
de expresión para evitar duplicaciones. Nuestra aplicación inyectiva asigna al 
punto de Q con coordenadas y = 0,000... y z=0,B,B,P,... el punto 
de S correspondiente al número x = 0,0.,B,0,B,03B3 ... Dedekind objetó a 
Cantor que esta aplicación no es biyectiva. En efecto, su imagen no incluye 
ningún punto de S cuya coordenada se exprese mediante un decimal infinito 
de la forma 0,E/€, . . . E0E/,,08,,10 ... (en el cual, indefinidamente, a partir 
de cierto dígito, hay, dígito por medio, un cero). Cantor aceptó esta crítica y 
elaboró otra demostración más engorrosa. Sin embargo, a la luz de un teo- 
rema demostrado (independientemente) por E. Schróder y F. Bernstein casi 
veinte años más tarde, el argumento original de Cantor resulta suficiente para 
probar la proposición II. Según ese teorema, si un conjunto a es inyectable 
en un conjunto b y b es inyectable en a, a y b son equinumerosos.?” Como 
es claro que el segmento $ se puede inyectar en el cuadrado O (por ejemplo, 
mediante la aplicación x => (x,x)), la existencia de una aplicación inyectiva 
de OQ en S prueba que tienen la misma potencia. El método seguido para 
definir la inyección de OQ en S se deja extender fácilmente al caso en que OQ 
sea un hipervolumen de cualquier dimensión. 

La publicación de la proposición III vino a agravar la llamada crisis de 
la intuición matemática en el último tercio del siglo XIX.* Intuitivamente 
parece haber una diferencia irreductible entre un recta y una superficie o un 
volumen. Los matemáticos conceptualizaban esa diferencia relacionándola 
con el número de coordenadas requerido para identificar cada punto de estos 
“continuos” (una, dos y tres, respectivamente). Por esta vía, se hacía fácil 
concebir los “hiperespacios” de más de tres dimensiones: era cosa de incre- 


Las primeras demostraciones del teorema de Schróder y Bernstein solían aducir premi- 
sas más fuertes de lo necesario. Se hallará una demostración más económica en Levy 
1980, pp. 85s. 

Se agrega a la “curva sin dirección” de Weierstraf, una función real continua pero 
no diferenciable. Precede a la “curva que llena una superficie” de Peano, aplicación 
continua de un segmento recto sobre un cuadrado. 
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mentar el número de coordenadas asignadas a sus puntos. Pero la proposición 
III muestra que basta con una sola coordenada para identificar los puntos de 
un continuo de cualquier número de dimensiones. Dedekind sugirió que sólo 
podía haber biyecciones continuas entre dominios equidimensionales. Pero 
trascurrirán más de 30 años antes de que Brouwer (1911, 1913) demuestre 
este teorema.” Para ello hubo que encontrar primero una caracterización viable 
del concepto de número de dimensiones. (Cf. D. M. Johnson 1978/81). 

Las proposiciones I y II distinguen dos clases de infinito: el infinito denu- 
merable de los enteros positivos y algebraicos, y el infinito mayor de los 
números reales. Cantor pronto conjurará una sucesión hiperinfinita de infi- 
nitos, cada cual más numeroso que los anteriores. Junto a su demostración 
de que todos los continuos son equinumerosos publicó una conjetura que 
luego intentará sin éxito demostrar: “Entre las variedades lineales infinitas 
no se encuentran más que dos potencias” (Cantor, GA, p. 133), a saber, la 
de los enteros y la de los reales. En otras palabras: un continuo C' nunca 
incluirá un subconjunto D que sea a la vez menos numeroso que C y más 
numeroso que los enteros positivos. Esta es la célebre Hipótesis del Conti- 
nuo de Cantor. 


? Cantor (1878) subraya que su rotulación de cada punto del plano mediante una sola 


coordenada supone que la parametrización no sea continua, pero expresamente deja 
abierta la cuestión que será resuelta por Brouwer (GA, p. 121). 


1.5 ARITMÉTICA TRANSFINITA 


Al comienzo del N* 5 de la serie “Sobre variedades lineales infinitas de pun- 
tos”, publicado en 1883, Cantor declara que sus investigaciones acerca de ese 
tema han alcanzado un punto desde el cual no puede dar ni un paso más con 
naturalidad (zwanglos) sí no extiende el concepto de número entero más allá 
de sus límites acostumbrados. Esta es su justificación o, “si fuese menester”, 
su excusa para introducir en ese escrito “ideas aparentemente extrañas”. Como 
explica enseguida, se trata de ampliar o, más bien, de continuar la serie de 
los números enteros “más allá del infinito” (GA, p. 165). 

Cantor sabía muy bien que la matemática tradicional —lo que habrían 
llamado “matemática clásica” en 1880 si este modo de expresarse hubiera 
sido corriente a la sazón— admitía el infinito sólo como una potencialidad 
inalcanzable y rechazaba de plano el infinito actual. 


Me parece que el infinito matemático, en la medida en que ha encontrado 
en la ciencia hasta la fecha una aplicación justificada y provechosa, se 
presenta ante todo en la acepción de una cantidad variable que, o bien 
crece más allá de todo límite, o bien decrece hasta ser arbitrariamente 
pequeña, pero que siempre sigue siendo finita. Llamo a este infinito, el 
infinito impropio (das Uneigentlich-unendliche). 

(Cantor, GA, p. 165) 


Cantor patrocina, en cambio, una concepción del infinito matemático como 
algo completamente determinado. Aduce como ejemplo el “punto en el 
infinito” utilizado ya entonces en la teoría de la funciones de una variable 
compleja. Pero, nos advierte, 


mientras el punto en el infinito del plano complejo se yergue solo frente 
a todos los puntos del dominio finito, aquí obtendremos no tan sólo un 
número entero infinito único, sino una secuencia infinita de tales números, 
que se distinguen bien unos de otros y sostienen relaciones aritméticas 
regulares entre sí y con los números enteros finitos. 

(Cantor, GA, p. 165) 
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El avance al transfinito procede en dos frentes. Ya conocemos uno. Vimos 
como Cantor demostraba que el conjunto [RR de los números reales (o de los 
puntos de la recta) incluye subconjuntos tales como el conjunto de los núme- 
ros enteros y el de los números algebraicos (respectivamente, los puntos con 
coordenadas enteras y con coordenadas algebraicas), que son infinitos pero 
menos numerosos que [R. Según esto, en [R hay por lo menos dos modos o 
niveles diferentes de infinitud. Cantor (1890/91) mostrará que, dado un con- 
junto cualquiera K, el conjunto de sus partes PK es siempre más numeroso 
que K. Resulta entonces que, si sobreentendemos con Cantor que, dado un 
conjunto, también está dado el conjunto de sus partes, basta que haya una 
numerosidad infinita, para que haya infinitas otras mayores que ella. Cantor 
elaborará una aritmética de tales numerosidades, con reglas precisas para 
la adición, la multiplicación, la exponenciación. Esta línea de avance tiene, 
con todo, un inconveniente: las numerosidades generadas por la operación 
K >PK se suceden, sí, de menor a mayor, pero no hay cómo saber si no 
existen numerosidades intermedias entre la numerosidad de un conjunto K y 
la numerosidad de PK. Pero Cantor avanzará al transfinito también por otro 
frente en el cual ese inconveniente no se presenta (al menos, si se acepta 
una hipótesis que él juzga verdadera). 

Cuando comparamos la numerosidad de dos conjuntos infinitos M, y 
M, con los métodos de la Capitulo 1.4 lo que hacemos puede describirse 
así: Los elementos del conjunto M, se emplean como índices para enumerar 
los elementos del conjunto M,; si alcanzan para todos, M, no es menos 
numeroso que M.,; pero si, como quiera que se marquen los elementos de 
M, con índices tomados de M,, necesariamente queda alguno sin marcar, 
es claro que M, es más numeroso que M,. Si luego queremos comparar la 
numerosidad de M, con la de un tercer conjunto M, no podemos usar a M, 
como conjunto de índices, sino que tenemos que valernos de los elementos 
de M, 0 M,. No es así como comparamos ordinariamente la numerosidad 
de conjuntos finitos. Antes bien, la serie de los enteros positivos, ordenada 
de menor a mayor, nos sirve aquí como único sistema de índices, con el 
cual enumeramos los elementos de cada uno de los conjuntos que queremos 
comparar. Por esta vía, junto con averiguar que uno de los conjuntos así 
enumerados es más numeroso que otro, se establece exactamente cuántas 
numerosidades intermedias hay entre las de esos dos conjuntos. La segunda 
línea de avance seguida por Cantor provee una continuación transfinita de 
la sucesión ordenada de los enteros. 


1.5 Aritmética transfinita 31 


La idea de una tal continuación surge con toda naturalidad del estudio de 
los conjuntos derivados de un conjunto de puntos. Cuando hablé de ellos 
en el Capítulo 1.3 me referí expresamente sólo a conjuntos de la n-ésima 
especie, cuyo n-ésimo conjunto derivado es finito, de suerte que el conjunto 
derivado (n + 1)-ésimo está vacío. Pero la recta incluye por cierto más de un 
conjunto de puntos P tal que, para cualquier entero positivo n, el conjunto 
derivado P” + Y, Tenemos además que, si bien P(” generalmente no es 
una parte de P (por ejemplo, si P es el conjunto de los puntos con coorde- 
nadas algebraicas, PV = [R), en cambio, P+D T P(" para todo n > 1. Por 
ende, Pz (LS, la intersección infinita NM. PWzD . Cantor llama a esta 
intersección “la derivación de orden oo” y la designa con el símbolo P(*”. 
Considera en seguida la serie de sus conjuntos derivados P(*2+D, ple). 
También P*> tiene su derivación de orden oo, generalmente no vacía. Cantor 
la designa con PP, “Prosiguiendo con estas construcciones conceptuales 
uno llega a derivaciones que es consecuente designar con P"22*M, donde n 
y m son números enteros posos (GA, p.147). La intersección NA peo 
debe llamarse entonces P(2>, El próximo paso natural es formar derivacio- 
nes cuyo orden está dado por un polinomio en oo de grado n (n > 1). La 
intersección infinita de tales derivaciones es, lógicamente, pes), 


Avanzando de modo consecuente se ganan sucesivamente los ulteriores 
conceptos: 


plo) plot!) ple plo) plo”) plo) etc; 


vemos aquí una generación dialéctica de conceptos que conduce cada 
vez más lejos, manteniéndose libre de toda arbitrariedad, como algo en 
sí mismo necesario y consecuente. 

(Cantor, GA, p. 148) 


Como el símbolo oo se utiliza tradicionalmente en matemáticas para significar 
el infinito potencial a que tiende una cantidad variable no acotada, Cantor lo 
reemplazó en 1883, en su nuevo uso, por el símbolo (m, que emplearemos 
en adelante (GA, p. 195n.). El objeto () surge, pues, como el primer índice 
transfinito en la serie de las derivaciones de un conjunto de puntos. Pero, 
al igual que los índices finitos, (9) y sus sucesores pueden separarse de esta 
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función y usarse para enumerar los elementos de otros conjuntos. Tomados 
así en abstracto constituyen, según Cantor, una continuación natural de la 
serie de los enteros positivos, suficiente para medir “todas las diversas nu- 
merosidades, en sucesión ascendente, presentes en la naturaleza corpórea y 
espiritual” (GA, p. 199). 

Antes de hacer esta asombrosa aseveración, Cantor explica ciertos concep- 
tos que precisan su sentido y alcance. Para facilitar la exposición adoptaré 
ciertas convenciones. Llamaré “ordinales” a los elementos —finitos y trans- 
finitos— de la serie cantoriana de enteros (este término, de uso corriente, 
corresponde al alemán Ordnungszahlen que Cantor emplea en sus publi- 
caciones desde 1887; GA, p. 388). Siguiendo la práctica actual, entenderé 
que el primer ordinal es el 0, no el 1 (cf. Cantor, GA, p. 445). Para denotar 
ordinales en general usaré las minúsculas del alfabeto griego, aunque recurriré 
a la cursiva minúscula de nuestro alfabeto cuando quiera referirme especí- 
ficamente a un ordinal finito, esto es, a un predecesor de (. La expresión 
“a < f” significa que O: precede a B en la sucesión de los ordinales. Puede 
leérsela “aL es menor que f” o “B es mayor que ot”. Por ahora —hasta el 
Capítulo 1.8— designaré con [o.] al conjunto de todos los ordinales menores 
que un cierto ordinal O. (Hoy día no se necesita un símbolo especial para 
designarlo, desde que von Neumann caracterizó los ordinales de tal modo 
que O. = [a] = (5:É < ay, por definición, véase la Sección 1.8.4.) Tenemos, 
entonces, que [a] < [B] si e < PB. Si los elementos de un conjunto K se 
dejan enumerar exhaustivamente utilizando en orden todos los predecesores 
del ordinal k, diré que k es un enumerador de K. (Con este término artificial 
traduzco aquí el vocablo alemán Anzahl, que Cantor usa en esta acepción). 

Obviamente, si k es un enumerador de K, los conjuntos K y [k] son 
equinumerosos. Si K es un conjunto finito, es decir, si algún k < (0 es un 
enumerador de K, entonces, no importa cómo K se enumere, su enumerador 
es siempre el mismo. Cabe afirmar, pues, que k mide la numerosidad de K 
o, como decimos ordinariamente en castellano, que k es el número de los 
elementos de K. (Así, por ejemplo, 4 es el número de los evangelios porque, 
en cualquier orden que se los tome, se los puede enumerar con los ordina- 
les del conjunto [4] = (0, 1, 2, 3)). Pero si K es infinito, admitirá distintos 
enumeradores según el orden en que se enumeren sus elementos. Por ejem- 
plo, si K = [0], su enumerador es ( si los elementos de K se toman en el 
orden habitual; pero es (? si se los enumera en el orden siguiente: primero 
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el O y el 1, seguidos de todos los números primos, 2, 3, 5, 7,...; luego los 
cuadrados de los números primos; luego sus respectivos cubos; ... ; luego 
la n-ésima potencia de cada primo, en orden ascendente; ... luego... Por 


eso, Cantor cree necesario distinguir entre el número (Zahl) y el enumerador 
(Anzahl) de un conjunto.' 

Evidentemente, una vez determinado el orden en que debe enumerarse un 
conjunto K, se fija de modo inequívoco su enumerador. De hecho, la enumera- 
ción exhaustiva de K por el conjunto ordenado [kx] introduce (o presupone) 
en K un orden particularísimo, a saber, el orden de los predecesores de k 
en la sucesión de los ordinales. Dicho orden tiene ciertas características ge- 
nerales, cualquiera que sea k. Desde luego, reúne todos los requisitos de lo 
que se llama un orden lineal, a saber, (i) si O, HB e [xk], se cumple en todo 
caso una y sólo una de estas tres alternativas: 4 < PB, o PB <a, o a = B; (ii) 
si 0, B, ye xk, 0 <B y B< y, entonces a. < y.? Pero no todo orden lineal 
concuerda con el orden de sucesión de los elementos de [k], para algún 
ordinal k. Considérese, por ejemplo, el conjunto de los enteros negativos, 
ordenados de menor a mayor, o el conjunto (cos x: O < x < Tr), ordenado 
por la magnitud del argumento x. Si k es un ordinal cualquiera, el conjunto 


Conviene observar que este distingo es tan ajeno al alemán como al castellano. En la vida 
diaria, *Anzahl” se usa en frases como “eine grofe Anzahl Kinder” (“un gran número 
de niños”), “eine Anzahl von 100” (“un centenar”). El uso matemático en tiempos de 
Cantor puede ilustrarse con el siguiente pasaje de Lipschitz, que Kronecker cita con 
aprobación en “Sobre el concepto de número” (1887, p. 342n.; cursiva mía): 


Wenn man bei der Betrachtung getrennter Dinge von der Merkmalen absieht, 
durch welche sich die Dinge unterscheiden, so bleibt der Begriff der Anzahl der 
betrachteten Dinge zuriick. 


Cuando en la consideración de cosas separadas se prescinde de los caracteres que 
las distinguen resta el concepto del número de las cosas consideradas. 


“Anzahl” se caracteriza aquí prácticamente en los mismos términos en que Cantor 
(1895/97, $ 1; GA, p. 282) define “Kardinalzahl” (número cardinal”). Por esos mis- 
mos años, Frege confirió a *Anzahl” un significado técnico especial distinto del que le 
da Cantor, mediante esta definición: “La Anzahl correspondiente al concepto F es la 
extensión del concepto “equinumeroso con el concepto F”” (1884, $ 68; pp. 79-80). 
También esta noción es afín a la cantoriana de “número cardinal”. 

El orden lineal así definido concuerda con lo que Cantor llama un “orden simple” (GA, 
pp. 296, 444). Sus definiciones tardías de conjunto bien ordenado presuponen explíci- 
tamente que se trata de un conjunto ordenado simplemente (GA, pp. 312, 444). 
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[x] es lo que Cantor llama un conjunto bien ordenado por la relación <.* 
En el referido escrito N” 5 Cantor explica que un conjunto bien ordenado 
(eine wohlgeordnete Menge) es un conjunto bien definido cuyos elementos 
están ordenados linealmente de tal modo que: 


BO1 


BO2 


BO3 


Hay un primer elemento, esto es, un elemento que precede a todos 
los otros. 

Todo elemento que precede a otros tiene un sucesor inmediato, esto 
es, un elemento que le sigue y precede a cualquier otro elemento 
precedido por él. 

S1 A es una parte no vacía —finita o infinita— del conjunto y los 
elementos del conjunto que siguen a todos los elementos de A 
forman otra parte no vacía B, entonces B tiene un primer elemento 
(esto es, hay un elemento de B que precede a cualquier otro ele- 
mento de B). 


Esta definición de conjunto bien ordenado (GA, p. 168) equivale a la defi- 
nición más sencilla que Cantor propuso en una carta a Dedekind el 28 de 


julio 


de 1899 (GA, p. 444) y que figura en los libros de texto actuales:* 


Como luego se verá, las condiciones BO1-3 con que Cantor inicialmente define el 
concepto de buen orden están calculadas para garantizar que el mismo sea aplicable 
a la sucesión de ordinales resultante de los “principios generadores” enunciados en 
Cantor 1883 (vide infra, pp. 36 s.). Por eso, quizás, Cantor no se molesta en demos- 
trar que la sucesión de los ordinales —y, por ende, cada segmento inicial suyo— está 
bien ordenada por la relación <. Para los lectores a quienes esto no les parezca obvio, 
Zermelo prueba —en una nota a su edición de los escritos de Cantor— que la sucesión 
de los ordinales cumple la condición BO (Cantor, GA, p. 208, n.4). Sea K cualquier 
conjunto de ordinales. Sea K* = (€: VUE € K > E < [)) (K* es el conjunto de los 
ordinales menores que cada elemento de K). Entonces, o bien K contiene el primer 
ordinal y éste es su primer elemento; o bien no lo contiene, y entonces K* + Y. En 
este caso, O bien K* tiene un elemento máximo HU, y el ordinal U + 1, determinado 
por el primer principio generador, es el primer elemento de K; o bien K* no tiene un 
elemento máximo, en cuyo caso el segundo principio generador determina un ordinal 
límite, sucesor próximo de todos los elementos de K*, que es el primer elemento de 
K. Así, en las tres alternativas posibles, K' tiene un primer elemento. 

Demuestro la equivalencia de ambas definiciones en el Apéndice l. El lector habrá 
advertido que la condición BO1 presupone que el conjunto en cuestión no está vacío. 
Por otra parte, (Y cumple trivialmente la condición BO: como Y no tiene ninguna parte 


1.5 Aritmética transfinita 35 


BO Un conjunto linealmente ordenado M se dice bien ordenado si cada 
parte no vacía A C M tiene un primer elemento. 


Como es obvio, un conjunto infinito numerable, esto es, un conjunto equi- 
numeroso con el conjunto [w] de los enteros positivos finitos, queda bien 
ordenado por cualquier aplicación biyectiva de [wm] sobre él. Pero ello, evi- 
dentemente, no implica que cualquier conjunto admita un ordenamiento de 
este tipo. Por ejemplo, como el lector fácilmente adivinará, no se conoce 
ningún procedimiento para bien ordenar el conjunto infinito de los puntos de 
un cuadrado. Ello no obstante, a la citada explicación del concepto de buen 
orden por Cantor sigue la siguiente extraordinaria declaración: 


El concepto de conjunto bien ordenado resulta ser fundamental para toda 
la teoría de las variedades (Mannigfaltigkeitslehre). Que siempre es posi- 
ble reducir cada conjunto bien definido a la forma de un conjunto bien 
ordenado es una ley del pensamiento, a mi modo de ver, básica y fecunda, 
y especialmente notable por su universalidad, a la cual retornaré en un 
trabajo posterior. 

(Cantor, GA, p. 169). 


Más tarde, Cantor no volverá a calificar esta proposición tan poco evidente 
como “ley del pensamiento”, y hasta hará un intento por demostrarla, que 
explico en el Capitulo 1.6. En el Capítulo 1.7 y en el Apéndice VI consideraré 
las demostraciones publicadas por Zermelo en 1904 y 1908. Desde entonces 
la proposición se conoce como el Teorema del Buen Orden y así me referiré 
a ella en lo sucesivo. Veremos que, al igual que el célebre Postulado V de 
Euclides, no puede demostrársela a menos que se acepte otra proposición 
que no es más obvia. Me parece, por eso, que Cantor puso de manifiesto 
un certero instinto matemático cuando intentó hacer pasar el Teorema del 
Buen Orden por un principio del pensamiento que no requiere demostración 
(así como Euclides mostró su genio al dar rango axiomático al Postulado 
V). Para su programa, el Teorema del Buen Orden era indispensable: la 
sucesión de los ordinales alcanza para enumerar todo lo que se presente en 


no vacía, no tiene una que carezca de un primer elemento. BO equivale a BO1 A BO2 
ABO3 si y sólo si M + (Y. Como Cantor no contemplaba la existencia de Y entendía 
seguramente que el conjunto al que se refiere la condición BO no estaba vacío. 
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la naturaleza corpórea y espiritual si —pero sólo si— cada conjunto puede 
ordenarse bien. A menos que todo conjunto sea bien ordenable no se justifica 
el tono triunfalista del siguiente pasaje: 


Una de las tareas más importantes de la teoría de los conjuntos, que 
creo haber resuelto en lo principal en [el escrito N* 5 de 1883], consiste 
en la exigencia de determinar las distintas valencias o potencias [esto 
es, las numerosidades] de las variedades presentes en la totalidad de la 
naturaleza, en la medida en que ésta se abre a nuestro conocimiento. Lo 
he logrado mediante la formación del concepto general del enumerador 
de un conjunto bien ordenado, o, lo que es lo mismo, del concepto de 
número ordinal. 


(Cantor 1887; GA, pp. 387s.) 


En el citado escrito N* 3 Cantor formula tres principios que según él presiden 
la generación de los ordinales. Observa que la serie de los enteros positivos 
finitos 1, 2,3,...,n,... surge del repetido “postular y reunir” (Setzung und 
Vereinigung) unidades que se consideran iguales. “El número n es a la vez la 
expresión de un determinado número finito de tales postulaciones sucesivas y 
de la reunión de las unidades postuladas en un todo” (GA, p. 195). La doble 
operación descrita ilustra un primer principio generador (Erzeugungsprinzip): 
“el principio de la adición de una unidad a un número ya formado”, el cual, 
según Cantor, desempeña también un papel esencial en la generación de los 
enteros transfinitos. Los números formados de este modo constituyen lo que 
Cantor llama la primera clase de números o la Clase (D. 


Aunque sería contradictorio hablar de un número máximo de la Clase (D, 
no hay nada chocante (nichts Anstóffiges) en concebir un nuevo número, 
que llamaremos (0, y que ha de ser la expresión de que todo el agregado 
() está dado en su sucesión natural conforme a la ley (al modo como n 
es la expresión de que un cierto número finito de unidades está reunido 
en un todo). 

(Cantor, GA, p. 195) 


Si a la postulación del número () siguen nuevas postulaciones de la unidad 
se obtienen, mediante el primer principio, los nuevos números O + 1, 0 
+2,..., 0+nMm,... No habrá entre ellos un número máximo que siga a 
todos los otros, pero se puede pensar en un número nuevo 2, que exprese 
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la reunión de aquéllos en un todo. Aplicando el primer principio a 20 se 
obtienen los números 20 + 1,20 +2,..., 20 +nm,...* Al lector des- 
prevenido esta proliferación de números le parecerá un truco de ilusionista, 
pero vimos arriba, a propósito de la formación de los conjuntos derivados 
de ciertos conjuntos de puntos, que la sucesión descrita aquí en abstracto por 
Cantor admite aplicaciones perfectamente bien definidas. (Piénsese también 
en esto: (0 es el enumerador del conjunto de los números pares; si a ese 
conjunto vamos agregando los impares 1, 3, 5,... y prescribimos que se 
los enumere “en orden de llegada”, es claro que se necesitarán los enume- 
radores 0 +1,0+2,0+3,...). 


La función lógica que nos ha suministrado los dos números O) y 20 es 
manifiestamente distinta de la del primer principio generador. La llamo 
el segundo principio generador de números reales enteros, que defino 
con más precisión así: cuando hay una sucesión determinada cualquiera 
de números enteros reales definidos, ninguno de los cuales es el mayor 
de todos ellos, se crea en virtud de este segundo principio generador un 
número nuevo, que se concibe como límite de todos esos números, vale 
decir, se lo define como el próximo sucesor de todos ellos (als die ihnen 
allen náchst grófere Zahl). 

(Cantor, GA, p. 196) 


Corrientemente se llama ordinal sucesor a uno generado conforme al primer 
principio y ordinal límite a uno generado conforme al segundo. Un ordinal 
límite no es el sucesor inmediato de otro ordinal; en cambio, cabe describir- 
lo como el sucesor próximo de los ordinales que le preceden, en cuanto él 
mismo precede a cualquier otro ordinal mayor que todos sus predecesores. 
Cantor observa que el ordinal (9 y los primeros ordinales sucesores y ordi- 
nales límites que le siguen tienen la propiedad de que el conjunto de sus 
respectivos predecesores es numerable.* Cantor hace de esta propiedad la 
característica esencial de lo que llama la segunda clase de números o Clase 


Como luego veremos, la multiplicación de ordinales no es conmutativa si uno de los 
factores es transfinito. En particular, 20 = (O) + (02. Por eso, Cantor llamará más tarde 
(M2 al número introducido aquí bajo la designación 20” (GA, p. 389). 

Desde luego, tienen esta propiedad los ordinales transfinitos (2 y (0? que he aducido 
como ejemplos, puesto que ellos enumeran, respectivamente, (1) el conjunto ordenado 
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(ID. Dicha propiedad puede verse como un tercer principio “de inhibición o 
limitación” (Hemmungs- oder Beschránkungsprinzip), en virtud del cual: 


(a;) Todo ordinal transfinito k formado conforme a los principios gene- 
radores tiene un conjunto de predecesores [k] equinumeroso con 
[0]. 


La Clase (II) está formada por ( y los ordinales sucesores y ordinales lí- 
mites que cumplen con la exigencia (a,). Cumple además las condiciones 
siguientes: 


(b,) El agregado de todos los números de la Clase (II) es más numeroso 
que el conjunto [w] de los números de la Clase (ID); y 
(c,) no existe una numerosidad intermedia mayor que la de la Clase (1) 


y menor que la de la Clase (ID).” 


Sea (0, el enumerador del conjunto de los ordinales de las Clases (1) y (ID), 
ordenados de menor a mayor. Consíderese ahora la condición 


(a,) [k] es equinumeroso con [(w,]. 


Los ordinales generados conforme a los principios cantorianos bajo esta 
condición forman una Clase (III) tal que 


(b,) el agregado de todos los ordinales de la Clase (III) es más nume- 
roso que el conjunto [w,] de los números de la Clase (ID); y 
(c,) no hay una numerosidad intermedia mayor que la de la Clase (II) 


y menor que la de la Clase (UD. 


En forma análoga, se forman las Clases (IV), (V),..., de ordinales, tales 


que forman todos los impares 1, 3, 5,... seguidos por todos los pares 2, 4, 6,... y (ii) 
el conjunto ordenado que forman los números primos 2, 3, 5, 7, 11,... seguidos por 
sus respectivos cuadrados, cubos, ...; y, evidentemente, cada uno de estos conjuntos 
puede biyectarse sobre el conjunto de los predecesores de (y) (con el cual se confunde, 
si olvidamos el orden). 


En el Apéndice II bosquejo su demostración de estas dos proposiciones. 
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que, para cada entero positivo n, (i) el conjunto [£] de los predecesores de 
cualquier ordinal € de la clase (n+1)-ésima clase es equinumeroso con el 
conjunto de los ordinales de la clase n-ésima; (11) la clase n-ésima es me- 
nos numerosa que la clase (n+1)-ésima; y (111) no existe una numerosidad 
intermedia entre las de las clases n-ésima y la (n+1)-ésima. Por otra parte, 
como Zermelo observa en su edición de los escritos de Cantor (GA, p. 199), 
los principios citados no bastan para establecer la existencia de una clase 
(m-ésima de ordinales. 

En sus obras más maduras, Cantor se refiere a esta serie ascendente de 
numerosidades infinitas conjurada por los sucesores de (y como a una serie 
numérica transfinita distinta de la de los ordinales, aunque asociada a ella: la 
sucesión de los números cardinales transfinitos o alephs (llamados así por la 
letra hebrea aleph, NX, que Cantor adoptó para nombrarlos). Para Cantor, el 
cardinal de un conjunto epitomiza lo que él llamaba su potencia o valencia y 
aquí he llamado su numerosidad. Si olvidamos todas las particularidades de 
los elementos de un conjunto K, recordando únicamente que son diferentes 
entre sí, obtenemos, según Cantor, un concepto que se aplica igualmente 
a K y a cualquier otro conjunto equinumeroso con K. Este concepto es lo 
que él llama el número cardinal (Kardinalzahl) de K. Si K es menos nu- 
meroso que otro conjunto L, decimos que el cardinal de K es menor que el 
cardinal de £. El conjunto de los cardinales finitos está bien ordenado por 
la relación “x es menor que y” —que simbolizaremos: x < y—, puesto que, 
evidentemente, hay un isomorfismo? de órdenes entre los cardinales finitos, 
ordenados por la relación <, y los enumeradores de los conjuntos respec- 
tivos, ordenados por la relación <. (Usaré también la abreviatura íx <= y” 
para decir íx < y o x = y”.) En virtud de este isomorfismo los cardinales 
finitos se identifican naturalmente con los respectivos ordinales y se conocen 
por los mismos nombres que éstos. Pero, como hemos visto, tal correspon- 
dencia no existe en el dominio transfinito. Cantor insiste, por ello, en que 
los cardinales transfinitos son otra clase de objetos que los ordinales y los 
designa con nombres peculiares. Así, el cardinal del conjunto [w] —o del 
conjunto de los predecesores de cualquier ordinal de la segunda clase— se 
llama X, (aleph cero); el cardinal del conjunto de los ordinales de segunda 
clase —o del conjunto de los predecesores de cualquier ordinal de la tercera 
clase— se llama N, etc. 

Como dije arriba, Cantor demostró que entre NX, y N, no puede haber 
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un cardinal intermedio (véase el Apéndice Il). Esta proposición se deja 
generalizar a cualquier ordinal k > 1: en otras palabras, si N, y NX,,, son 
los cardinales de los conjuntos K y K”, respectivamente, no puede haber 
un conjunto K” más numeroso que K y menos numeroso que K”. Sea K un 
conjunto infinito cualquiera. Si K admite un buen orden hay un ordinal que 
lo enumera, y K es equinumeroso con el conjunto de los predecesores de 
ese ordinal. Por lo tanto, el cardinal de K es X, (para algún ordinal A). Pero 
si K no admite un buen orden, no hay ningún ordinal que lo enumere y el 
cardinal de K no pertenece a la secuencia de los alephs. Peor aún, como 
demostrará Hartogs (1915), a menos que todo conjunto sea bien ordenable, 
habrá numerosidades incomparables, esto es, pares de conjuntos K y K” tales 
que K no es ni más ni menos numeroso que K” ni equinumeroso con él. 

Está claro, entonces, que la pretensión de Cantor de haber provisto un 
sistema numérico suficiente para medir todas las numerosidades de la na- 
turaleza depende enteramente del Teorema del Buen Orden. Por otra parte, 
si —como él— lo damos por supuesto, obtenemos sólo la seguridad de 
que todas esas numerosidades son medibles a ojos de Dios, puesto que 
nosotros no somos capaces de bien ordenar ni siquiera el conjunto de los 
puntos de un intervalo, ni, en general, ningún conjunto que no sea finito o 
numerable. Por esta razón, la clara jerarquía de los alephs correspondientes 
a las sucesivas clases de ordinales transfinitos resulta de poco interés fuera 
del recinto cerrado de la teoría cantoriana si no se la vincula a la serie 
ascendente de numerosidades generada en el primer frente del avance al 
transfinito por la operación K > PK. Como veremos un poco más adelante, 
es fácil probar que el conjunto [R de los números reales es equinumeroso 
con P[w]. La Hipótesis del Continuo significa, entonces, que no hay con- 
juntos de numerosidad intermedia entre la de [0] y la de P[w], de modo 
que el cardinal de P[w] —y de R— es precisamente N,. La Hipótesis del 
Continuo constituye así el primer eslabón de una cadena que vincularía la 
jerarquía de los alephs a las numerosidades generadas por la operación K 
> PK. Por eso, Cantor se empeñará mucho en demostrar la Hipótesis del 
Continuo y se sentirá atribulado por su fracaso. La cadena se completa con 
la llamada Hipótesis Generalizada del Continuo, formulada en el espíritu de 
Cantor por sus sucesores: 
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HGC — Si X,es el cardinal de un conjunto K, el cardinal de PK es NM 
cualquiera que sea el ordinal k. 


k+l> 


HGC implica el Teorema del Buen Orden (pero no es implicada por él). 
Por lo tanto, sólo cabría admitirla como un principio que no se demuestra. 
Volveremos sobre esto en la Tercera Parte. Es claro que bajo HGC los 
alephs darían abasto para cubrir todas las numerosidades de la “naturaleza 
corpórea y espiritual”. 

Con clara conciencia de lo que se espera de un “número” de veras digno de 
ese nombre, Cantor pone especial cuidado en definir las operaciones aritmé- 
ticas elementales aplicables a sus ordinales y cardinales. No podemos entrar 
en detalles, pero un par de indicaciones darán una idea de este asunto. 

Aunque la aritmética transfinita ordinal precede históricamente a la car- 
dinal, es más fácil explicarla si hablamos primero de ésta. Este es el orden 
que Cantor mismo sigue en su presentación final del tema (Cantor 1895/97; 
GA, pp. 282ff.), en la que me basaré. Como ya he dicho, para Cantor el 
cardinal de un conjunto K es el concepto abstracto que se forma olvidando 
todas las propiedades y relaciones de los elementos de K excepto una sola, a 
saber, que cada uno de esos elementos es idéntico consigo mismo y diferente 
de todos los demás. Como es obvio, el mismo concepto se obtiene a partir 
de cualquier conjunto equinumeroso con K.* Para referirme a los cardinales 
—finitos o transfinitos— usaré como Cantor letras góticas, 4D, C,... Can- 
tor designa el cardinal del conjunto K mediante el símbolo E , pero aquí lo 
llamaremos |Kl, como es ahora habitual. Por definición, la suma a + b de 
dos cardinales a y b es el cardinal de la unión de dos conjuntos disjuntos 
cualesquiera tales que a y b sean sus repectivos cardinales. En otras palabras, 
sia =l4lyb=IB y ADB=Y, a+ b=!lA4 U Bl. El producto ab de dos 
cardinales a y b se define así: si a = 1Al y b = IBl, sea A x B el conjunto 
de todos los pares ordenados (a,b), tales que ae A y be B; entonces ab = 
lA x Bl. Cantor muestra que bajo las condiciones antedichas, ab es asimismo el 
cardinal del conjunto construido formando la unión de a conjuntos disjuntos 


La caracterización cantoriana de los cardinales recuerda, sin duda, la definición de Frege, 
según la cual el cardinal de una clase C es la clase de todas las clases equinumerosas 
con C, pero no debe confundirse con ella. La definición de Frege identifica el cardinal 
de la clase C con la extensión del concepto con el cual lo identificaría Cantor si C 
fuese en efecto un conjunto. 
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equinumerosos con B; en otras palabras, si a = lAl, y para todo h, k € A, b 
= IB, y B, MN B,=Y si h 4 k, entonces ab = Wic4Bi? Es fácil verificar 
que la adición y la multiplicación así definidas son operaciones conmutativas 
y asociativas: a+b=b+aja+(b+c)=(a + b)+<; ab= be; a(bc) = 
(ab); y que la multiplicación es distributiva sobre la adición: a(b + () = 
ab + ac. Asimismo, si llamamos O al cardinal de Y y 1 al de un conjunto 
unitario, es claro que a+ 0 = a, 0a =0 y la = a. Cantor mostró además 
que si a =< b, hay un cardinal c tal que b=a+c, y queesia=<byc=<0D, 
entonces 4 + C<b+0D y ac=< bb. Hasta aquí, pues, la aritmética transfinita 
cardinal no difiere de la finita. Por otra parte, se puede demostrar que si a 
es un cardinal transfinito y n es un cardinal finito, € + n = (1. Hessenberg 
(1906) estableció que, para cualquier ordinal k, N, + N, = N,, de lo cual 
se deduce fácilmente que si k <A, N ¿+ N,= Ny. 

Para definir la exponenciación de cardinales Cantor define lo que llama 
“cubrimiento” de un conjunto N con un conjunto M (Belegung von N mit 
M), como “una ley en virtud de la cual se le asocia a cada elemento n de N 
un determinado elemento de M, pudiendo usarse repetidas veces un mismo 
elemento de M.” Un cubrimiento de N con M es pues precisamente lo que 
hoy se llama una aplicación? de N en M, y usaré este término en lugar del 
utilizado por Cantor. Por definición, si a = lAl y b = IBl, a? es el cardinal 
del conjunto de todas las aplicaciones de B en A. Cantor muestra que la 
operación así definida obedece a las leyes familiares de la exponenciación 
finita: Pa! = q, (aby = ate, 

Es claro que, si f es finito, É< 2! Cantor demostró que f<2! también si f 
es infinito. Por su importancia, este aserto se llama comúnmente el Teorema 
de Cantor. La siguiente prueba, sencilla y elegante, se publicó en Cantor 
1890/91 (GA, pp. 279s.). Sea K un conjunto infinito y F el conjunto de todas 
las aplicaciones de K en (0,1). Sea f:K — F una aplicación inyectiva. Para 
mayor claridad escribo f, en vez de f(x), para designar el valor asignado 
por f ax € K. Considérese la aplicación q de K en (0,1) definida así: p(x) 
=0si f£. 60) = 1 y 00) = 1 si f,0) = 0. Obviamente, € difiere de f, para 
cada x e K. Por lo tanto, q es un elemento de F' que cae fuera del alcance 


En estas explicaciones he empleado la terminología y simbolismo actuales. 


10 Estos resultados se demuestran en todos los buenos manuales de teoría de conjuntos, 


por ejemplo, en Levy 1979, 11.3. 
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de la aplicación inyectiva f. Por ende, f no es una biyección de K en F. 
Como este argumento es aplicable a cualquier inyección de K en F, IKl < 
IFI = 2'Xl, El argumento ilustra un modo de razonar —el llamado “método 
diagonal”— que Russell utilizará en la construcción de la paradoja que lleva 
su nombre (Capítulo 1.6) y Gódel en la demostración de su primer teorema 
de incompletud (Capítulo 2.10).!! 

Ahora mostraré que si K es un conjunto cualquiera, el conjunto PK de 
todas las partes de K es más numeroso que K. Este resultado asegura una 
provisión inagotable de cardinales transfinitos diferentes (si suponemos, 
como Cantor al parecer suponía, que existe un conjunto infinito y que la 
existencia de un conjunto implica la existencia del conjunto de sus partes). 
Es una consecuencia inmediata del Teorema de Cantor. En efecto, cada 
elemento H de PK —es decir, cada conjunto H € K— está asociado a una 
determinada aplicación de K en (0,1), la función característica Xy definida 
así para cada k € K: xy(k)=1 sike H y xu(k)=0 si k € H.? Por otra 
parte, cada aplicación x:K — (0,1) determina un elemento de PK, a saber, 


Aunque suele atribuírsele a Cantor, el método diagonal fue empleado antes por Paul du 
Bois-Reymond (1875, p. 365n.) para demostrar que, dada una secuencia de funciones 


reales A;, A, ... que crecen monotónicamente sin cota ( lim A, (x) = 00 ), pero cada cual 
más lentamente que la anterior (lim == 0 ), existe siempre una función real A que 
we A (x) 
k 


crece sin cota, pero más lentamente que cualquiera de las A,. En términos generales, el 
método puede describirse así: dado un conjunto % y una “función de dos variables” g 
definida en 9?, pasamos a considerar la diagonalización de g, esto es, la “función de 
una variable” h definida en Y por la condición h(x) = g(x,x). El nombre “diagonalización” 
se justifica fácilmente en caso que Y sea finito o enumerable, ya que entonces los 
valores de g se pueden desplegar naturalmente en una matriz cuya diagonal exhibe los 
valores de h. La popular demostración de la indenumerabilidad del continuo publicada 
en Cantor 1890/91 (GA, pp. 278f.) ilustra el método diagonal en esta forma: Sea Q 
una aplicación inyectiva de [0] en I = (0,1]. Sea 0,ajyd;¡dz>  - - Azo- -. la representación 
de (k) mediante su expansión decimal infinita. Sea, para todo ordinal finito h, a, = 1 
si Aj, 4 1 y a, = 2 si aj, = 1. Entonces, 0,aya¡a, ...a,... es la expansión decimal 
infinita de un elemento de I que cae fuera del alcance de la aplicación Q, puesto que 
difiere de q(k) en el k-ésimo decimal. Por lo tanto, no existe una aplicación biyectiva 
de [(w] en L, de suerte que [wm] es menos numeroso que Il. 

Mas adelante, cuando hablemos de Gódel, será preferible definir con él la función ca- 
racterística Xy de un conjunto H por la condición Xy(k) =0 sike H y xg(k) = 1 si k 
£ H. Como es obvio, cualquier decisión en esta materia es puramente convencional. 


A4 El Paraíso de Cantor 


el conjunto (k e K: x(k) = 1). Por lo tanto, 14 KI = 2'*! > |Kl. En particular, 
el cardinal del conjunto de las partes del conjunto [wm] de los ordinales finitos 
es 2%, puesto que NX, es, por definición, el cardinal de [w]. 2% es también 
el cardinal del continuo, como paso a demostrar. Sea I = (0,1] < R (I es el 
conjunto de los números reales x tales que O < x < 1). Vimos en el Capitulo 
1.3 que I es equinumeroso con un continuo de cualquier dimensión. Sea a 
e I Entonces a puede representarse mediante su expansión decimal infinita 
0,aa,4,... 4, ..., donde para cada ordinal finito k, a, es uno de los diez 
dígitos y hay un entero h > k tal que a, + O. También puede representárselo 
mediante su expansión binaria infinita, cuya definición es la misma que la 
anterior, excepto que para cada ordinal finito k, a, es uno de los dos dígitos 
del sistema binario: O ó 1. Ahora bien, una tal expansión binaria infinita 
puede leerse como la lista de los valores de la aplicación de [w] en (0,13 por 
k'> aj, que es la función característica del conjunto A de ordinales finitos 
definido por la condición: ke H sia, =1 yk HB si a, =0. La corres- 
pondencia así establecida entre las referidas expansiones binarias y ciertos 
subconjuntos de [wm] determina una aplicación inyectiva f: I= P[0]. f no 
es biyectiva, pues su alcance comprende solamente los subconjuntos infinitos 
de [00]. En efecto, si AH < [0] es finito, A contiene un elemento máximo », 
de modo que Xy (rm) = 0 para todo ordinal finito m > n y la lista de valores 
de Xy no es la expansión binaria infinita de ningún número. Sin embargo, 
como hay solamente un número finito de partes diversas de [(w] que tienen 
el mismo elemento máximo n es claro que el conjunto de las partes finitas 
de [(w] es numerable. Por lo tanto, si U es la unión del intervalo (0,1] con 
un conjunto numerable, por ejemplo, con el conjunto (x: x es racional y 1 
< x < 2), se puede definir una aplicación biyectiva f”: U—= P[o], tal que 
f es la restricción de f' a (0,1]. Por lo tanto, el cardinal de U es idéntico 
al cardinal de P[w]. Como (0,1] y (0,2] son equinumerosos y (0,1] cU<c 
(0,2], es claro que 1(0,1]1 = IUl = |P[0]! = 2%. En vista de esto, la Hipótesis 
del Continuo puede enunciarse —como es habitual— así: 


N 20 (HC) 
El argumento anterior ofrece una prueba más de que el conjunto de los ordi- 


nales finitos es menos numeroso que el continuo. 
Para entender la aritmética ordinal conviene explicar primero el concepto 
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cantoriano de tipo de orden. Sea K, un conjunto no vacío y P, una relación 
binaria entre miembros de K, (i = 1, 2). Decimos que la estructura (K,,P) 
es isomórfica a la estructura (K,,P,) si hay entre ellas un isomorfismo, esto 
es, una aplicación biyectiva f:K, —> K, tal que, para todo x, y € K;, x tiene 
la relación P, con y si y sólo si f(x) tiene la relación P, con f(y) (simbóli- 
camente: xP¡y S F)P,f()). Si P, es una relación de orden lineal, el tipo 
de orden de (K,P,) es, según Cantor, el concepto que se forma al hacer 
abstracción de todas las particularidades de los elementos de K, excepto (1) 
la identidad de cada uno consigo mismo y su diversidad de los otros y (11) el 
orden entre ellos determinado por la relación P,. Obviamente, este concepto 
es común a todas las estructuras isomórficas a (K,,P,).!* Cantor llama simi- 
lares (áihnlich) a los conjuntos que tienen un mismo tipo de orden, término 
que usaré en lo sucesivo. En 1897 Cantor define los ordinales como los tipos 
de orden de los conjuntos bien ordenados (GA, p. 321). En particular, cada 
ordinal k, formado con arreglo a los tres principios enunciados por Cantor 
en 1883, habrá de identificarse simplemente con el tipo de orden de los 
conjuntos bien ordenados similares con ([k],<). Volveré sobre esto después 
de explicar la adición y multiplicación de tipos de orden. 

Cantor designa los tipos de orden con minúsculas griegas. La suma QL 
+ PB de dos tipos de orden a: y PB se define como el tipo de orden de la 
estructura (K,P) construida así: (i) tómese una estructura (K,,P,) de tipo QL 
y una estructura (K,,P,) de tipo PB, tales que K, A K, = 9; (ii) sea K = K; 
U K,; (111) defínase así el orden lineal P en K: xPy si y sólo si x, y € K; 
y xPy, osixe K,e y € K). El producto aiB de a: y $ se define como el 
tipo de orden de la estructura (K,P) construida así: (i) tómese una estructura 
(K,,P,) de tipo Q£ y una estructura (K,,P,) de tipo f, tales que K, A K, = 
(SD; (ii) fórmese una colección de copias disjuntas de (K,P,), una para cada 
elemento de K,; sea en particular (K,(x),P,) la copia correspondiente a x € 
K,; (111) sea K la unión de las copias de K, (K = (48 x1K¡60)|); Gv) defínase 
así el orden lineal P en K: uPw si y sólo si u, w € K;(x) para un cierto 
x€ K, osiue Kí(x) y w € K,¡(y) y xP,y. Las operaciones así definidas 


Siguiendo a Cantor, he restringido la definición de tipo de orden a los órdenes lineales; 
pero puede extendérsela sin más a cualquier estructura que posea algo que pudiéramos 
llamar un orden. Por ejemplo, es natural decir que los puntos de una circunferencia 
exhiben un tipo de orden (cíclico) que tienen también los puntos de una recta en el 
plano proyectivo o los rayos que salen de un punto en el plano euclidiano. 
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son Obviamente asociativas, pero no son conmutativas, como muestran los 
siguientes ejemplos: (1) 1 + 0% 0 + 1, puesto que O) + 1 es el tipo de orden 
de la estructura ([oJu(w),<) y 1 + O es el tipo de orden de la estructura ((1) 
U ([ONX1p,< = ([0],<) (de modo que 1 + O = 0). (ii) 20 + (02, puesto 
que (02 es el tipo de orden de la estructura (La: A < WM y O. es parju(B: 
PB < O y B es impary,P), donde € Pn si € es par y n es impar, osió¿ yn 
son pares y E<nN,Osi¿ y n son impares y £ < n, de suerte que (02 + 
(Mm; pero 2w es el tipo de orden de la estructura Us < Rk,2k+15,<), así que 
20 =m.!* 

Al definir “ordinal? como “tipo de orden de un conjunto bien ordenado” 
Cantor se desentiende de los principios generadores enunciados en 1883. El 
nuevo concepto de ordinal es más amplio que el anterior, puesto que cubre 
también el tipo de orden de un conjunto bien ordenado K cuyo cardinal sea 
Y, para algún k => (0, y los principios de 1883 no bastan para generar un 
ordinal con N,, predecesores. Es importante cerciorarse de que ésta es una 
ampliación natural, que preserva los caracteres estructurales del concepto 
primitivo. Para facilitar el examen de este asunto, llamaré, por ahora, *P-or- 
dinales? a los miembros de la sucesión generada en virtud de los principios 
de 1883 y “T-ordinales” a los tipos de orden de los conjuntos bien ordenados. 
Usaré las minúsculas griegas para referirme a ordinales de ambas clases, pero, 
para evitar confusiones, la letra irá seguida de un asterisco cuando designe 
un P-ordinal. Veremos que cada P-ordinal puede asimilarse plausiblemente 
a un determinado Trordinal y que los T-ordinales que no son P-ordinales 
se ordenan naturalmente en una sucesión que prolonga la sucesión de los 
P-ordinales. 

Si k es un elemento de un conjunto bien ordenado (K,P), designo con 
el símbolo [k] el segmento (Abschnitt) de K determinado por k, esto es, el 


Ia Cantor (1883) ofrece este curioso comentario acerca de la no-conmutatividad de la 


adición y multiplicación cuando uno de los sumandos o factores es transfinito y el 
otro no: 


Como se ve claramente, todo depende de la posición (Stellung) de lo finito hacia 
lo infinito; si aquél se adelanta, se disuelve en lo infinito y desaparece en su seno; 
pero si se modera y toma su lugar detrás de lo infinito, entonces se conserva y 
se une a éste para formar un infinito nuevo, modificado. 

(Cantor, GA, p. 177) 
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conjunto (x e K: xPk) que forman los predecesores de k.!'% Los segmentos 
de (K,P) constituyen una parte de P(K) bien ordenada por la relación C. 
Llamémosla F(K). La aplicación [k] > k es un isomorfismo entre (F(K),C) 
y (K,P). Cantor mostró que si K y H son conjuntos bien ordenados por las 
relaciones P y O, respectivamente, y (K,P) no es similar a (H,0), entonces 
(K,P) es similar a un segmento de (H,0», o (H,O) es similar a un segmento 
de (K,P). Este resultado es el Teorema 13N en Cantor 1897.'? Este teorema 
permite definir una relación de precedencia < entre los T-ordinales: UL < 
B si y sólo si Q: es el tipo de orden de un segmento de un conjunto bien 
ordenado cuyo tipo de orden es f. Es claro, además, que si k es el tipo de 
orden de un conjunto bien ordenado (K,P), cada ordinal € tal que € < k es 
el tipo de orden de cierto segmento [z] de (K,P). La aplicación € => [z] es 
un isomorfismo entre ([x],<) y (F(K),C). Por lo tanto, la aplicación [ => z 
es un isomorfismo entre ([x],<) y (K,P), de suerte que el T-ordinal « es en 
efecto el tipo de orden del conjunto de sus predecesores. Supongamos ahora 
que (K,P) es enumerado por el P-ordinal k*. Esto significa, sencillamente que 
hay un isomorfismo entre (K,P) y ([x*],<). En tal caso, ([k*],<) es isomórfico 
a ([x],<). En virtud del teorema 13N, es claro que si (K,,P,) es un conjunto 
bien ordenado numerable por un P-ordinal y (K,,P,) es un conjunto bien 
ordenado que ningún P-ordinal alcanza para enumerar, (K,,P,) es similar a 
un segmento de (K,,P,), a saber, aquél cuyo tipo de orden corresponde, en 
virtud del isomorfismo antedicho, al P-ordinal que enumera a (K,P,). Estos 
resultados justifican, sin duda, la identificación de cada P-ordinal k* con el 
tipo de orden de los conjuntos bien ordenados que k* enumera. La sucesión 
de los T-ordinales que no pueden identificarse así con un P-ordinal obvia- 
mente continúa la serie de los que admiten tal identificación. Por lo tanto, 
de ahora en adelante, hablaré simplemente de “ordinales? —sin prefijo— y 
los designaré con minúsculas griegas sin asterisco. 


Para que k e K determine un segmento de K, Cantor requiere que k no sea el primer 
elemento de K. Esta restricción es innecesaria si se admite la existencia del conjunto 
vacío. Si k es el primer elemento de K, [k] = 9; en tal caso, [k] < K, como cualquier 
otro segmento de K. 


GA, pp. 319s. Bosquejo la demostración en el Apéndice II. 
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En el Capítulo 1.5 reproduje la prueba original del Teorema de Cantor por 
el método diagonal. Como un corolario del mismo, probé que, si K es un 
conjunto cualquiera, |Kl < IPP KI. La prueba del corolario se basó en que cada 
aplicación de K en (0,1) es la función característica Xy de un determinado 
conjunto AH C K. Ahora mostraré cómo fundir ambas pruebas en una, de 
suerte que el aserto de que IKl < I%PKI para todo conjunto K venga a ser 
sólo otro modo de expresar el Teorema de Cantor, f < 2. Sea, como antes, 
F el conjunto de las aplicaciones de K en (0,1). Entonces F = (Xy :H Cc Kj 
y hay una biyección canónica g: Xy >H de F en PK. Si f:x => f, designa, 
como en el Capítulo 1.5, una inyección cualquiera de K en F, la aplicación 
compuesta gf (= g o f) es una inyección cualquiera de K en PK que asigna 
a cada x e K, un conjunto H, < K. Consideremos otra vez la aplicación Q 
e F, definida de modo que, para cada x € K, p(x) + f,(0). q es la función 
característica de un determinado conjunto G < K. G queda caracterizado por 
el hecho de que, para cada x e K, q(x) = 1, y, por ende, f(x) = 0. En otras 
palabras, x e G si y sólo si x 4 H,. Así, pues, G es el conjunto formado 
por los elementos de K' que no pertenecen al conjunto que respectivamente 
les asigna la inyección gf. Si G = H, para un cierto a e K, tendremos que 
ae Gsi y sólo si a £ H, = G. Esta contradicción implica que G cae fuera 
del alcance de la inyección gf, y que ésta no es una aplicación biyectiva. 
Como gf es una inyección cualquiera, no hay una biyección de K a PK. 
Por lo tanto, IKI < IP KI. 

El Teorema de Cantor y su demostración fueron reformulados en térmi- 
nos similares a éstos por Bertrand Russell (1903, $$ 346-347). La principal 
diferencia reside en que Russell no habla de conjuntos, sino de clases, esto 
es, de extensiones de conceptos.! En la versión de Russell, el Teorema de 


“Una clase es... todos los objetos que satisfacen una función proposicional” (Whitehead 
y Russell, 1910-13, t. L p. 23). El término “función proposicional” se explica así: “Sea 
(x un enunciado (statement) que contiene una variable x y que se convierte en una 
proposición cuando se le asigna a x cualquier significado determinado fijo. Entonces 
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Cantor dice, pues, que cualquier clase es menos numerosa que la clase de sus 
subclases.? En la misma obra, Russell nos cuenta que descubrió la paradoja 
que hoy lleva su nombre reflexionando justamente sobre las consecuencias 
del Teorema de Cantor. Dicha paradoja surge al considerar la clase de todas 
las clases que no son miembros de sí mismas. Si llamamos C, a esta clase 
russelliana, designamos con “(x: px)” la clase de todos los objetos x que sa- 
tisfacen la condición qx, y simbolizamos con “y e z'e “y € z' los enunciados 
“y pertenece a la clase z' e “y no pertenece a la clase z”, tenemos que: 


Cr = fx: xes una clase y x £ x) 


Si a es una clase cualquiera, es claro que a e Cy si y sólo si a £ a. En 
particular, si la clase cualquiera considerada es la misma Cy, se obtiene la 
contradicción: 


Cr€ Cr O Cp £ Cr 


(x se llama una “función proposicional”” (p. 14). Cada objeto a tal que la proposición 
Qa es verdadera “satisface” la función proposicional qx y es, por ende, un miembro de 
la clase determinada por esta función proposicional. Aunque hay profundas diferencias 
entre Principia Mathematica, de donde tomo estas definiciones, y The Principles of 
Mathematics de 1903, en este punto concuerdan. Leemos en The Principles que “bx 
es una función proposicional si, para todo valor de x, (x es una proposición, determi- 
nada si x es dado” (Russell 1903, $ 22) y que “los valores de x que hacen verdadera 
la función proposicional qx [...] en general forman una clase y de hecho una clase 
puede definirse como todos los términos que satisfacen alguna función proposicional” 
($ 23). 

No es obvio para mí que el argumento que Russell toma de Cantor demuestre el teorema 
en su nueva versión. En efecto, si tomamos en serio la explicación lógico-lingiística 
de la noción de clase recogida en la nota 1, el número de subclases no vacías de una 
clase C no es mayor que el número de funciones proposicionales diferentes que satis- 
facen uno o más miembros de C. Si cada función proposicional es un enunciado, el 
número de las mismas dependerá de la índole del lenguaje que se usa. En particular, 
si el lenguaje es la “escritura conceptual” de Frege (1879), o la pasigrafía de Peano 
(1895 y ss.), o el sistema desarrollado más tarde por el mismo Russell (Whitehead y 
Russell, 1910-13), cualquiera de los cuales sólo admite oraciones de longitud finita 
con a lo sumo Xy predicados diferentes, el número total de enunciados diferentes que 
es posible hacer en él no es mayor que NX. A menos, claro está, que haya enunciados 
—específicamente, funciones proposicionales— inefables. 


1.6 Paradojas y filosofemas 51 


Esta contradicción es fatal para el sistema de fundamentación de la 
aritmética y el análisis elaborado por Frege en Grundgesetze der Arithmetik 
(1893/1903) y así lo reconoce el autor en un epílogo al tomo II (1903, pp. 
252ss.), en el cual informa sobre la carta que Russell le envió el 16 de junio 
de 1902, cuando ese tomo ya estaba en prensa.? Me refiero a ese sistema 
en el Capitulo 2.2, la Sección 2.3.3 y los Apéndices X y XII. La contradic- 
ción subsiste, claro está, si y e z' significa, como de costumbre, “y es un 
elemento del conjunto z? y pretendemos designar con Cp = (x: x € x) el 
conjunto de todos los conjuntos que no son elementos de sí mismos. Pero 
puesta en esta forma no afecta la coherencia del pensamiento de Cantor, ya 
que éste no presupone que cada conjunto corresponda a un concepto, ni que 
cada concepto determine un conjunto. 

Cantor deja muy en claro su posición a este respecto en una carta a Dede- 
kind del 3 de agosto de 1899 (publicada en 1932; Cantor, GA, pp. 443ss.).* 
Presenta allí lo que hoy se conoce como la Paradoja de Burali-Forti, mas 
no como paradoja, sino simplemente como una indicación de que hay plu- 
ralidades, bien definidas mediante una caracterización verbal, que no forman 
una unidad, es decir, un conjunto. Al comienzo de la carta Cantor distingue 
dos especies de “pluralidad determinada (bestimmte Vielheit)”. 


En efecto, una pluralidad puede ser de tal índole que el supuesto de que 
todos sus elementos “existen conjuntamente” (die Annahme eines “Zusam- 
menseins” aller ¡hrer Elemente) lleva a una contradicción, de modo que 
es imposible captar esa pluralidad como una unidad, como “una cosa aca- 
bada”. A tales pluralidades las llamo pluralidades absolutamente infinitas 
o inconsistentes. [...] 


En su respuesta a Russell, el 22 de junio de 1902, Frege le dice que “su descubri- 
miento de la contradicción me ha sorprendido muchísimo y casi querría decir que me 
ha consternado, puesto que sacude el fundamento sobre el cual yo pensaba que podía 
construirse la aritmética” (Frege, WB, p. 213). En cambio, el joven Zermelo, que había 
descubierto la Paradoja de Russell un año antes, no la publicó y continuó sus inves- 
tigaciones sobre la teoría de conjuntos sin hacerle caso, seguramente porque entendía 
que no era un obstáculo serio para dicha teoría. Véase Rang y Thomas 1980. 


Zermelo la publicó en el apéndice de Cantor, GA, confundida con otra del 28 de julio, 
de la que provienen los cuatro primeros párrafos de la p. 443. La carta del 3 de agos- 
to empieza en el quinto, con la frase “Gehen wir von dem Begriff einer bestimmten 
Vielheit ... aus”. Cf. Dauben 1979, p. 352; Grattan-Guimness 1974. 
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En cambio, si la totalidad de los elementos de una pluralidad se deja con- 
cebir sin contradicción como “estando reunida” (als “zusammenseiend”), 
de modo que es posible captarla conjuntamente como “una cosa”, la llamo 
pluralidad consistente o “conjunto” (“Menge”). 

(GA, p. 443) 


Siguen tres asertos, en el estilo que se usará más tarde para enunciar axiomas 
de la Teoría de los Conjuntos: 


Dos pluralidades equinumerosas son o bien ambas “conjuntos”, o bien 
ambas inconsistentes. 


Una pluralidad que es parte de un conjunto es un conjunto. 


Todo conjunto de conjuntos, cuando éstos se disuelven en sus elementos, 
es también un conjunto. 
(GA, p. 444) 


El tercer aserto significa lo mismo que el Axioma V de Zermelo: “A cada 
conjunto T corresponde un conjunto ST cuyos elementos son precisamente 
todos los elementos de los elementos de 7” (Zermelo 1908a). La segunda 
alternativa mencionada en el primer aserto desconcierta a primera vista, ya 
que presupone que tiene sentido hablar de equinumerosidad entre pluralidades 
inconsistentes, aunque ninguna de ellas pueda considerarse como “una cosa 
acabada”. Pero a la luz del uso que le da luego, me parece que todo lo que 
Cantor ha querido decir aquí es que si hay una pluralidad inconsistente y 
cada elemento discernible en ella puede ponerse en correspondencia exclu- 


Las expresiones “pluralidad consistente” y “pluralidad inconsistente” (konsistente, 
bzw. inkonsistente Mannigfaltigkeit) habían sido utilizadas por Schróder en un libro 
publicado en 1890 (VAL, vol. L p. 213) para referirse a pluralidades que podemos o, 
respectivamente, no podemos concebir como un todo (als ein Ganzes denken—p. 212). 
Como ejemplo de pluralidad inconsistente cita un par de proposiciones contradictorias, 
porque según él “el espíritu humano no es capaz de reunirlas”. Sin embargo, cualquier 
demostración por reducción al absurdo tiene que reunir las conclusiones contradictorias 
que deriva de la hipótesis que intenta refutar, para concluir que dicha hipótesis es falsa. 
Es por cierto imposible concebir una situación que realice (“sea un modelo de”) un 
par de proposiciones contradictorias, pero eso no impide concebir el todo formado por 
las proposiciones mismas. 
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siva con un elemento de otra pluralidad, y viceversa, entonces esta última 
también es inconsistente. 

A continuación Cantor define los conceptos de “orden simple” (nuestro 
“orden lineal”) y “tipo de orden”, y dice que una pluralidad simplemente or- 
denada se dice bien ordenada cuando cada una de sus partes tiene un primer 
elemento. Agrega que, en aras de la brevedad, llamará “secuencia” (*Folge”) 
a toda pluralidad bien ordenada, y observa que cada parte de una secuencia 
es también una secuencia. Define luego “número ordinal” como el tipo de 
orden de un conjunto bien ordenado y pasa a considerar “el sistema de to- 
dos los ordinales”, que designa con la letra Q.* Recuerda haber demostrado 
que si o. y B son ordinales diferentes, o bien a. < B, o bien B < 01; que si 
a, B y y son ordinales tales que O. < B y B < y, entonces OL < y, y que si 
Z es una colección de ordinales hay en Z un ordinal que precede a todos 
los otros. Concluye que el sistema (2 forma una secuencia ordenada por <. 
Por lo tanto, si (2 fuese un conjunto, su tipo de orden sería un determinado 
ordinal €. Entonces €, el tipo de orden de (2, sería un ordinal posterior a 
todos los elementos de Q. Pero € e Q, puesto que Q es el sistema de todos 
los ordinales. Por lo tanto, € < £.” Esta contradicción se llama Paradoja de 
Burali-Forti, porque el matemático italiano la adujo —con otro propósito— en 
un artículo publicado en 1897. Cantor infiere de ella, sencillamente, que el 
sistema de los ordinales no es un conjunto sino una pluralidad absolutamente 
infinita o inconsistente. 

Enseguida nos invita a considerar el sistema de todos los alephs, que 
designa con la última letra del alfabeto hebreo, N (tav). Como hay un aleph 
Y, para cada QU € (2, la inconsistencia de (2 implica que N es inconsistente 


Conviene quizás anotar que la expresión que usa Cantor para abreviar “Ordnungszahl” 
(“número ordinal”) es “Zahl” (número”). 

El razonamiento resulta quizás más claro si invocamos la Proposición 4 del Apéndice 
II: Un conjunto bien ordenado no puede ser isomorfo a uno de sus segmentos. Pero 
si el ordinal [ e Q es el tipo de orden de Q, Q es isomorfo a [€], el segmento de Q 
determinado por €. El lector a quien, con toda razón, le moleste la idea de que una 
pluralidad inconsistente se diga bien ordenada puede reordenar así el razonamiento de 
Cantor: Suponga primero que (2 es un conjunto; muestre que si lo es, está bien orde- 
nado por <. Por lo tanto, Q tiene un tipo de orden € e Q y es isomorfo al segmento 
[E] < Q. Como esto es imposible si Q está bien ordenado, Q no es un conjunto. 


Burali-Forti 1897. Explico el argumento de Burali-Forti en el Apéndice IV. 
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(en virtud del primero de los tres asertos iniciales de Cantor arriba citados). 
Cantor basa en esta conclusión un argumento que según él demuestra que 
el cardinal de un conjunto infinito siempre es un aleph: Sea V una plura- 
lidad infinita cuya numerosidad no es un aleph. Es claro, entonces, que, 
cualquiera que sea el ordinal QL, si f es una inyección de [a] en V, f, no 
es una biyección. De esto se sigue, según Cantor, que (2 es equinumeroso a 
una pluralidad V” < V.? Por lo tanto, en virtud de los dos primeros asertos 
iniciales de Cantor citados arriba, V” y V son pluralidades inconsistentes y V 
no puede ser un conjunto. Si el argumento precedente es válido, constituye 
una demostración fácil del Teorema del Buen Orden: toda pluralidad cuyo 
cardinal sea un aleph se deja biyectar en un segmento de (2 y bien ordenar 
por ésta, y una pluralidad que no se deja bien ordenar, lisa y llanamente no es 
un conjunto.!% Esta demostración —“por exclusión de lo disconforme”— en- 
cierra un peligro. Como nadie sabría coordinar los puntos de un trazo con 
un segmento de (2, se puede pensar —o decidir— que ellos no constituyen 
un conjunto. Este diagnóstico afectaría asímismo al sistema R de los nú- 
meros reales y a todas las pluralidades equinumerosas con él. Para eliminar 


Cantor no explica cómo llega a esta conclusión. Pero he aquí un modo como pudiera 
haberla defendido. Digamos que una aplicación g está incluida en una aplicación h 
(simbólicamente, g C h) si el dominio de g está incluido en el dominio de h y g(x) = 
h(x) para cada x en el dominio de g. Sea V una pluralidad infinita cuyo cardinal no es 
un aleph. Como V es infinito, es claro que hay una inyección f,,: [0] —> V. Como el 
cardinal de V no es MX, es claro que f,, no es biyectiva y que hay por lo menos un 
elemento de V que no está en el alcance de f,,. Partiendo de f,, puede establecerse una 
secuencia transfinita de aplicaciones f,,: [a] — V tales que, para cualesquiera ordinales 
transfinitos o. y B <Q, (1) fg < fo (1 f, es inyectiva y (i1i) f,, no es biyectiva. Sea 
0 > () y supongamos que fy está definida y satisface las condiciones (1)-(1i1) para todo 
ordinal transfinito B < Q.. Si Q£ es un ordinal sucesor, hay un PB > O tal que =$ +1, 
y hay un elemento vg € V que no está en el alcance de fp. f,: [B + 1] — V se define 
así: si Y< B, FAY) = Fay; FAB) = vg. Si 0, es un ordinal límite, f,, se define así: para 
cada ordinal transfinito $ < a, £,I[B] = Sp Fo coincide con fy en el dominio de esta 
última). Estas definiciones aseguran que f,, cumple en ambos casos las condiciones (i) 
y (11). Es obvio que también cumple la condición (iii), ya que de otro modo el cardinal 
de V sería un aleph. La correspondencia QU. > f,(0) entre 2 y la pluralidad (f,(0):0L 
e Q) = V c V es biunívoca. 

Se sabe que en 1896 ó 1897 Cantor envió a Hilbert una demostración del Teorema del 
Buen Orden. No conocemos su tenor, pero G. H. Moore (1982, p. 51) conjetura que 
se basaba en el mismo argumento utilizado en la carta a Dedekind del 2 de agosto de 
1899. Hilbert no se dejó convencer. 
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esa Opción —ruinosa para el proyecto de fundar el análisis en una teoría 
de conjuntos— Cantor tendría que haber suplementado su demostración del 
Teorema del Buen Orden con una prueba de la Hipótesis del Continuo. 

Zermelo, que publicó dos pruebas bastante más elaboradas del Teorema 
del Buen Orden en 1904 y 1908, levantó en 1932 dos objeciones contra el 
argumento de Cantor: En primer lugar, la biyección de (2 en una parte de 
V que Cantor invoca pero no define, tendría, al parecer, que definirse me- 
diante una secuencia transfinita de selecciones sucesivas, lo cual significaría 
aplicar nuestra intuición del tiempo a un proceso que rebasa toda intuición. 
En segundo lugar, “la demostración opera con pluralidades “inconsistentes”, 
y hasta posiblemente con conceptos contradictorios, y ya por eso sería ló- 
gicamente inadmisible” (Cantor, GA, p. 451 n. 1). La primera objeción es 
sin duda correcta.!! En sus demostraciones del Teorema del Buen Orden, 
Zermelo la elude gracias a su famoso Axioma de Selección, que autoriza la 
selección simultánea de un número infinito de objetos (vide Capitulo 1.7). 
La segunda objeción, en cambio, me parece confusa. Contradictorio y, por 
ende, lógicamente inadmisible, sería suponer que alguna de las pluralidades 
inconsistentes mencionadas en la prueba de Cantor es una unidad, esto es, 
un conjunto, pero no veo que su razonamiento envuelva tal suposición. 

A Zermelo le ha inquietado quizás la liviandad con que Cantor designa 
mediante una sola letra (Q, V) a pluralidades que juzga imposible concebir 
como unidades. Por la misma índole de tales pluralidades no está claro de 
qué manera o en qué preciso sentido puede uno referirse a ellas con un 
nombre o un pronombre. Á primera vista parecería que una tal referencia no 
es posible: si la existencia conjunta de los elementos de una cierta pluralidad 
implica contradicción una denominación que pretendidamente los abarque 
a todos simplemente no designa nada. Sin embargo, es claro que una frase 
castellana como “los ordinales” se refiere a cada ordinal, aunque sea impo- 
sible referirse a todos. Por ejemplo, si asevero que entre los ordinales no 
hay un máximo, digo, sin ambigiiedad ni oscuridad alguna, que para cada 
ordinal hay otro que le sigue. En general, si el predicado “es un P” distingue 
ciertos objetos, puede usárselo en expresiones nominales tales como “los P” 
o “Lx:x es un P)” para denotar a esos objetos en su disgregada pluralidad 


nl Cf. la construcción explicada en la nota 9. Obsérvese que envuelve la selección sucesiva 


de objetos v, e V, uno para cada QU. e (2. 
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aunque no se dejen congregar en un conjunto. Diré que la referencia a esos 
objetos en tal caso es distributiva, pero no colectiva. Llamaré “designador 
distributivo? a una expresión utilizada para referirse distributivamente a 
ciertos objetos.!? Claro está que la referencia distributiva inevitablemente 
confiere una suerte de unidad a la pluralidad referida. Se corre, entonces, 
el riesgo de tratar a ésta de palabra como lo que no es de veras: un objeto 
susceptible de agruparse con otros en nuevas unidades. En la Sección 1.8.4 
consideraremos el procedimiento adoptado por von Neumann en la década de 
1920 para obviar este riesgo, y que consiste en tratar a las pluralidades que 
Cantor llamó inconsistentes como un tipo de objetos, sí, pero inconfundible 
con los objetos ordinarios y en particular con los conjuntos, por cuanto en 
una aseveración de la forma 'x e y” ('x es un elemento de y”) un objeto de 
ese tipo sólo puede ser denotado por y, nunca por x. 

El reconocimiento de que no toda pluralidad bien definida, esto es, caracte- 
rizada mediante un criterio diagnóstico preciso, es un conjunto en el sentido 
de Cantor no es fatal para su programa, pero suscita un problema que marcará 
todo el ulterior desarrollo del mismo por otros autores. Cantor alude a él ya 
en una tercera carta a Dedekind, del 28 de agosto de 1899. Específicamente, 
se pregunta cómo puede uno saber que las pluralidades bien ordenadas a las 
que él asigna los cardinales Ny, N¡,..., No, --- No . . . Son efectivamente 
conjuntos. “¿No pudiera pensarse que ya estas pluralidades son “inconsisten- 
tes”, sólo que la contradicción inherente en suponer la “existencia conjunta 
de todos sus elementos” todavía no se ha hecho notar?” (GA, p. 447). Su 
respuesta es tan audaz como profunda: 


La pregunta debe extenderse también a las pluralidades finitas y un 
examen detenido conduce al resultado siguiente: aun en el caso de las 
pluralidades finitas no cabe dar una “prueba” de su “consistencia”. En 
otras palabras: el hecho de la “consistencia” de las pluralidades finitas es 
una verdad simple, indemostrable, es “el axioma de la aritmética” (en el 
antiguo sentido del término). Y del mismo modo, la “consistencia” de las 
pluralidades a las que asigno los alephs como cardinales es “el axioma 
de la ampliada aritmética transfinita”. 

(Cantor, GA, pp. 447-48) 


de Por ejemplo, la frase “universo del discurso”, empleada en semántica para referirse a 


todo cuanto pueda ser tema de conversación en el lenguaje bajo estudio, es ciertamente 
un designador distributivo si el lenguaje en cuestión es natural. 
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Esta respuesta tiene dos aspectos que consideraré sucesivamente: (A) La duda 
señalada afecta a la aritmética finita no menos que a la transfinita. (B) El 
matemático tiene la libertad de superar tales dudas postulando axiomas. 


(A) En un escrito anterior Cantor ya había observado que las limitaciones 
humanas que alegadamente impiden o entraban la matemática del infinito 
dificultan asímismo la consideración de cantidades finitas —al menos cuando 
son muy grandes— y que los recursos de que la matemática se ha valido 
tradicionalmente para superar tales limitaciones le sirven también para 
pensar sobre lo infinito. El 28 de febrero de 1886 Cantor dirigió una carta 
al médico berlinés, Dr. A. Eulenburg, sobre el “horror del infinito” común 
entre médicos y hombres de ciencia. Luego la publicó, con otras sobre temas 
afines, en una revista filosófica, bajo el título de “Comunicaciones sobre la 
doctrina del transfinito” (Cantor 1887/88). La versión impresa incluye una 
larga nota sobre el infinito matemático en la obra de San Agustín, Orígenes 
y Santo Tomás de Aquino. Cantor cita in extenso el Capítulo 19 del Libro 
XII de La Ciudad de Dios, donde San Agustín refuta a quienes sostienen 
que las cosas “que son infinitas no pueden ser comprendidas ni siquiera 
por el conocimiento divino”. No puede ser, dice San Agustín, que Dios no 
conozca todos los números. Ahora bien, “cada número está determinado por 
sus propiedades, de modo que ninguno de ellos puede ser igual a otro. Por lo 
tanto, son desiguales y diversos entre sí, y aunque cada uno es finito, todos 
son infinitos (et singuli quique finiti sunt, et omnes infiniti sunt).” Puesto que 
lo que el conocimiento comprende tiene que “estar definido (finitur) por la 
comprensión de quien conoce”, la infinidad de los números “está definida 
(finita est) para Dios de cierta manera inefable (quoddam ineffabile modo)”. 
Según Cantor, cuando San Agustín afirma que Dios capta totalmente, en forma 
intuitiva, la multitud infinita de los números, “reconoce al mismo tiempo este 
conjunto formalmente como un todo infinito actual, como un Transfinitum, y 
nos vemos compelidos a seguirle en esto” (GA, p. 402). Se objetará quizás 
que, aunque estemos forzados a admitir que el conjunto N de los enteros 
positivos es un objeto infinito, no nos es lícito entrar a considerar su ordinal 
(M ni su cardinal NX, por cuanto “nosotros, en nuestra esencial limitación, 
no somos capaces de captar con un solo golpe de vista (uno intuitu) todos 
los infinitos números individuales n que pertenecen al conjunto N.” Contra 
esta objeción, Cantor aduce que nadie es capaz de “representarse uno intuitu 
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distinta y precisamente” todas las unidades comprendidas en un número finito 
bastante grande, por ejemplo, mil millones. 


Y sin embargo tenemos derecho a considerar los números finitos, por 
grandes que sean, como objetos del conocimiento discursivo humano, e 
investigarlos científicamente según su modo de ser. El mismo derecho nos 
compete con respecto a los números transfinitos. 

[...] 

Rara vez poseemos un concepto del que se pueda decir que es un 
“conceptus rei proprius ex propriis”, con el que captamos y conocemos 
adecuadamente una cosa tal como es en y por sí misma, sin ayuda de la 
negación, de un símbolo o de un ejemplo. Antes bien, en nuestro conocer 
dependemos casi siempre de un “conceptus proprius ex communibus” que 
nos capacita para determinar una cosa mediante predicados generales y 
con ayuda de comparaciones, exclusiones, símbolos o ejemplos, de suerte 
que se distinga bien de cualquier otra cosa. Compárese, por ejemplo, el 
método [explicado en el Capítulo 1.3] que usé para definir las magnitudes 
numéricas irracionales. lré al extremo de aseverar incondicionalmente 
que este segundo modo de determinación y delimitación de las cosas es 
incomparablemente más sencillo, más cómodo y más fácil en el caso de 
los números transfinitos pequeños (por ejemplo, O, u O + 1, u 0", si v es 
un entero finito pequeño) que tratándose de números finitos muy grandes, 
en cuyo caso, sin embargo, también hemos de recurrir al mismo medio 
auxiliar ajustado a nuestra naturaleza imperfecta. 

(Cantor, GA, pp. 402-3) 


(B) La libertad del matemático es el tema de lo que, a mi modo de ver, es el 
texto filosófico más importante que nos ha dejado Cantor. Constituye el $ 8 
del escrito N* 5 de la serie “Sobre variedades lineales infinitas de puntos”, 
que ya he citado varias veces. Empieza distinguiendo dos sentidos en que 
cabe hablar de la existencia (Existenz) o realidad actual (Wirklichkeit) de 
los números enteros, finitos o infinitos. Por una parte, podemos considerar 
que ellos existen 


en cuanto ocupan, sobre la base de definiciones, un lugar enteramente de- 
terminado en nuestro entendimiento, se distinguen perfectamente de todos 
los demás componentes de nuestro pensamiento, tienen determinadas rela- 
ciones con ellos, y así modifican de una determinada manera la sustancia 
de nuestro espíritu. Permitáseme llamar esta forma de realidad (Realitát) 


1.6 Paradojas y filosofemas 59 


de nuestros números su realidad intrasubjetiva O inmanente. 
(Cantor, GA, p. 181) 


Por otra parte, en cuanto las distintas clases de números, (D), (ID), (ID, etc., 
son representantes de numerosidades que efectivamente se encuentran en la 
naturaleza, 


cabe también atribuir a los números realidad actual (Wirklichkeit) porque 
hay que verlos como una expresión (Ausdruck) o reflejo (Abbild) de sucesos 
y relaciones en el mundo exterior que enfrenta al intelecto. [ ... ] Llamo 
esta segunda forma de realidad la realidad transubjetiva o trascendente. 

(Cantor, GA, p. 181) 


Ahora bien, la matemática, “en la elaboración de su caudal de ideas, tiene que 
considerar única y exclusivamente la realidad inmanente de sus conceptos, y 
no tiene ninguna obligación de examinarlos en lo que respecta a su realidad 
trascendente” (GA, p. 182). Cantor no piensa, sin embargo, que cualquier 
concepción arbitraria, con tal que no genere contradicciones, tiene derecho 
a un lugar en el sistema de las ideas matemáticas. “La matemática es com- 
pletamente libre en su desarrollo”, pero éste está sujeto a dos restricciones: 
los conceptos matemáticos deben estar libres de contradicción interna, y 
además deben “estar en relaciones firmes, ordenadas mediante definiciones, 
con los conceptos previamente formados, ya existentes y probados” (GA, p. 
182).!* Esta doble exigencia “deja al arbitrio un campo muy reducido”. Más 
aún, “cada concepto matemático lleva en sí el correctivo necesario: si no es 
idóneo y fecundo, él mismo lo demuestra muy pronto con su inutilidad, y 
es entonces descartado por falta de éxito.” En cambio, según Cantor, 


cualquier estrechamiento superfluo del afán de investigación matemática 
envuelve un peligro mucho mayor, tanto más grande cuanto que no puede 


Cantor prosigue: “En particular, al introducir nuevos números [la matemática] sólo 
está obligada a dar de ellos definiciones que les confieran una tal determinación y, 
eventualmente, una tal relación con los números más antiguos, que, dado el caso, se 
puedan distinguir entre ellos de un modo determinado. En cuanto un número satisface 
todas estas condiciones se puede y se debe considerarlo como existente y real (existent 
und real) en la matemática” (GA, p. 182). 
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dársele ninguna justificación basada en la esencia de la ciencia; pues la 
esencia de la matemática consiste justamente en su libertad. 
(Cantor, GA, p. 182) 


Con todo, en el mismo $ 8 en que defiende tan rotunda e inequívocamente 
los derechos de una matemática autónoma, basada en su propia inventiva 
y fiel sólo a su propia historia, Cantor declara su convicción personal de 
que la realidad inmanente y la realidad trascendente siempre concuerdan, 
en cuanto 


un concepto que deba caracterizarse como existente en el primer sentido 
siempre posee también una realidad trascendente en ciertos —y en verdad, 
en infinitos— respectos, cuya comprobación, claro está, es en general 
una de las tareas más laboriosas y difíciles de la metafísica y suele tener 
que diferirse hasta que el desarrollo natural de una de las otras ciencias 
descubra el significado transcendente del concepto en cuestión. 

(Cantor, GA, p. 181)'* 


Esta creencia de Cantor hace comprensible —aunque en mi parecer no justi- 
fica— dos epígrafes latinos que puso a la cabeza de su obra más madura, 
“Aportes a la fundamentación de la teoría de los conjuntos transfinitos” 
(1895/97), a saber, la frase de Newton, “hypotheses non fingo” (“no forjo 
hipótesis”), y otra, tomada de Francis Bacon, según la cual “no le damos 
leyes al intelecto y a las cosas según nuestro arbitrio, sino que como es- 
cribas fieles anotamos y transcribimos las que anuncia y pronuncia la voz 
de la propia naturaleza.”!?% Un tercer epígrafe, tomado de la Biblia, evoca 
la observación, arriba citada, de que la comprobación de la realidad trascen- 
dente de los conceptos matemáticos debe dejarse al trabajo futuro de otras 


14 Cantor agrega en una nota que esta convicción suya concuerda con los principios de 


la filosofía de Platón y “con un rasgo central del sistema de Spinoza”, el expresado 
en la Prop. VII de la Parte II de la Ética: “El orden y la conexión de las ideas es el 
mismo que el orden y la conexión de las cosas” 


Dauben (1979), pp. 236-39, explica que con las expresiones citadas Cantor buscaba 
sobre todo manifestar su rechazo de los infinitésimos y la geometría no-arquimédica de 
Veronese (¿así entendía la libertad de la matemática?). Dauben señala que en una carta 
a Vivanti del 13 de diciembre de 1893, en la que ya aducía —contra Veronese— la cita 
de Bacon, Cantor equipara “la naturaleza” con “lo posible”. A la luz de la referencia 
a Spinoza en Cantor 1883 (v. nota 14), me parece que esta equiparación no significa, 
como sugiere Dauben, que lo que aquí se llama “la naturaleza” no es más que “lo 
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disciplinas: “Digo cosas que ahora están ocultas, pero llegará el tiempo en 
que una persistente diligencia las saque a la luz del día.” 

La polémica apasionada de Cantor en la década de 1880 contra quienes, 
desde Aristóteles, han negado el infinito actual, puede entenderse como un 
primer paso hacia la certificación de la realidad trascendente de los conceptos 
inventados por él, pero también como un intento para demostrar informal- 
mente su consistencia.'? En una carta a G. Enestróm del 4 de noviembre 
de 1885 (Cantor 1886), distingue tres modos como puede considerarse —y 
cuestionarse— el infinito actual: (1) en cuanto es “lo absoluto” en Dios eterno 
omnipotente y extramundano o natura naturans; (11) en cuanto es “lo transfi- 
nito”, presente en concreto en la natura naturata, y (111) en cuanto puede ser 
captado en abstracto por el conocimiento humano “en la forma de números 
actualmente infinitos —o transfinitos, como los he llamado— o en la forma 
aún más general de los tipos de orden transfinitos” (GA, p. 372). Dejando 
de lado el primer modo, Cantor señala que los otros dos dan lugar a cuatro 
posiciones filosóficas diferentes: algunos, como Cauchy, Gaufi, León XIII (en 
la encíclica De philosophia christiana) y “todos los llamados positivistas”, 
niegan el infinito actual en concreto y en abstracto; otros, como Descartes, 
Spinoza, Leibniz, Locke, Lotze, lo sostienen en concreto y lo niegan en 
abstracto; algunos neoescolásticos lo niegan en concreto pero lo afirman en 
abstracto; por último, 


el infinito actual puede ser afirmado tanto en concreto como en abstracto; 
pocos toman esta posición, que considero la única correcta; quizás sea 
yo el primero que representa este punto de vista con plena decisión y en 
todas sus consecuencias, pero estoy seguro de que no seré el último en 
defenderlo. 

(Cantor, GA, p. 373) 


posible”, sino que “lo posible” es nada menos que “la naturaleza”: para Cantor, como 
para nuestro contemporáneo David Lewis, lo posible es lo realmente real. 

16 Cantor 1883, 1886, 1887/88 (GA, pp. 165ss., 370ss., 379ss.). Dauben 1979, Capítulo 
6, resume y comenta muy bien “la filosofía del infinito” contenida en estos escritos. 
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Según Cantor, el error de los positivistas consiste en que de antemano atri- 
buyen “o más bien imponen” a todos los números las propiedades de los 
números finitos, “mientras que los números infinitos, si en absoluto han de 
ser concebibles de algún modo, tienen que constituir, por su oposición a 
los números finitos, una clase de números totalmente nueva, cuya índole 
depende enteramente de la naturaleza de las cosas y es objeto de investiga- 
ción, no de nuestro arbitrio o de nuestros prejuicios” (GA, p. 372). Así, 
todos los argumentos de Aristóteles contra el infinito actual (por ejemplo, 
en Metaph. K, 10) se basan en el supuesto de que no hay más que números 
finitos, supuesto que Aristóteles infería, a su vez, de que sólo había cono- 
cido enumeraciones de conjuntos finitos (GA, p. 174). De un modo análogo, 
Santo Tomás de Aquino niega que pueda haber una multitud actualmente 
infinita, por cuanto toda multitud es una multitud de una cierta especie, las 
especies de multitud corresponden a las especies de números, y ninguna de 
éstas es infinita, ya que todo número es una multitud medida por el uno 
(Summa theol. 1, q. 7, art. 4); pero este argumento desconoce que “en lo 
transfinito está presente y en cierto modo almacenada una riqueza mucho 
mayor de formas y de “species numerorum” que en el campo relativamente 
pequeño de lo finito ilimitado” (GA, p. 404). Por último, el enfático rechazo 
del infinito actual por grandes matemáticos del siglo XIX como Cauchy y 
Gauf se explica en parte, según Cantor, como una reacción contra el uso y 
abuso de lo infinitamente pequeño en la matemática del siglo XVIII —que 
también Cantor repudia— pero también debe atribuirse a “una especie de 
miopía, que nos roba la posibilidad de ver el infinito actual, a pesar de que 
en [la forma de] su portador supremo y absoluto nos creó y nos conserva 
y en sus formas secundarias, transfinitas, nos rodea por todas partes y mora 
en nuestro espíritu” (GA, pp. 374-75). 


Trascribo este pasaje, destacado en el original por el autor, porque Michael Hallett, 
en un libro por lo demás bastante instructivo, hace gran caudal de lo que llama “el 
principio del finitismo de Cantor”, que formula así: “Lo transfinito está a la par con 
lo finito y matemáticamente se lo debe tratar, en lo posible, igual que a lo finito (like 
the finitey” (Hallett 1984, p. 7). 


1.7 EL TEOREMA DEL BUEN ORDEN 
Y EL AXIOMA DE SELECCIÓN 


“Aportes a la fundamentación de la teoría de los conjuntos transfinitos” 
(1895/97) es la última publicación importante de Cantor. Deja sin resolver los 
dos problemas de cuya solución —como vimos en el Capitulo 1.5— depende 
la alegada suficiencia de la aritmética transfinita cantoriana para medir todas 
las multitudes del universo: el problema del continuo y el problema del buen 
orden. Cantor no tuvo éxito en sus intentos por demostrar la Hipótesis del 
Continuo y no logró persuadir a Hilbert con su demostración del Teorema 
del Buen Orden (Capitulo 1.6, nota 10). En una famosa conferencia ante el 
Segundo Congreso Internacional de Matemáticos (París, 1900), Hilbert plan- 
teó 23 problemas que la matemática del siglo XX debía encarar. El primero 
de todos es “el problema de Cantor de la cardinalidad del continuo”. Las 
investigaciones de Cantor sobre “los conjuntos de números reales ordinarios 
o puntos” sugieren un teorema que Hilbert considera muy plausible: Todo 
conjunto infinito de números reales es equinumeroso ya sea con el conjunto 
de los enteros positivos (1, 2,... $, ya sea con el conjunto de todos los rea- 
les, es decir, con el continuo mismo. Á este propósito, Hilbert menciona otra 
tesis de Cantor que quizás encierre la clave de una demostración del teorema 
anterior: El conjunto de todos los números reales se deja ordenar bien. 


Me parece sumamente deseable obtener una prueba directa de este no- 
table aserto de Cantor, tal vez indicando efectivamente un ordenamiento 
de los números tal que dentro de cada subconjunto pueda señalarse un 
primer número. 

(Hilbert, GA, II, p. 299) 


El Tercer Congreso Internacional de Matemáticos se reunió en Heidelberg 
en el verano de 1904. El 10 de agosto, Julius Kónig presentó un argumento 
que demostraba, según él, que el cardinal del continuo no es un aleph y 
que, por consiguiente, el conjunto de los números reales no puede ser bien 
ordenado. Esta conclusión se deduce de la igualdad 
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(donde o. es un ordinal cualquiera), que Kónig toma de la disertación doctoral 
completada en 1901 bajo la tuición de Hilbert por el discípulo de Cantor, 
Felix Bernstein. Es fama que Cantor quedó consternado después de escuchar 
la ponencia de Kónig; pero esa misma noche Zermelo detectó una falla en 
su razonamiento y la comunicó al Congreso al otro día: la demostración 
de la igualdad (1) ofrecida en la disertación de Bernstein no vale con toda 
la generalidad requerida por Kónig, sino únicamente si 0. < (1 (y de hecho 
Bernstein mismo usa (1) sólo en este caso).! Seis semanas después, en una 
carta fechada el 24 de septiembre, Zermelo hizo llegar a Hilbert la prueba 
del Teorema del Buen Orden que bosquejaré a continuación. 

Como Zermelo (1904) señala al final de su prueba, ella depende esencial- 
mente del siguiente supuesto: 


AS Si K es una colección de conjuntos no vacíos y K es el conjunto de 
todos los elementos pertenecientes a los conjuntos de la colección 
HK (K = US), hay una aplicación f:X —> K tal que, para cada k e 
K, FU) € K. 


Como f, por así decir, “selecciona” un elemento de cada conjunto de la 
colección H, diré que f es un selector para % y llamaré a f(k) el elemen- 
to selecto del conjunto k. Para probar que un conjunto cualquiera M + Y 
se deja ordenar bien, Zermelo considera un selector para ZMN(D), al que 
designa con la letra y (y selecciona un elemento en cada parte no vacía de 
M). Diremos, con Zermelo, que una parte G de M es un y-conjunto si G 
está bien ordenada por una relación <¿ y, para g e G, g = “Míxe G: 
x<c8)) (g es el elemento seleccionado por y en el complemento en M del 


; Kónig 1905 es una versión corregida de esta ponencia. Allí Kónig admite que sólo 
ha demostrado la proposición condicional: “Si el lema (1) de Bernstein vale para 
todo ordinal A, entonces la Hipótesis del Continuo es falsa”. Como, por otra parte, 
la falsedad de la hipótesis del continuo implica el lema (1), la negación de este lema 
puede tomarse como una formulación alternativa de la Hipótesis del Continuo que los 
partidarios de ésta podrían ensayarse en demostrar. Kónig 1905a combate la posibilidad 
de bien ordenar el continuo con otro argumento. 
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conjunto de los predecesores de g en (G,<¿)). Diremos asímismo que un 
elemento g e M es un y-elemento sí g pertenece a un y-conjunto. Así, por 
ejemplo, es claro que el elemento selecto de M, y(M), es un y-elemento, 
puesto que (y(M)) reúne los requisitos para ser un y-conjunto (está bien 
ordenado, en un sentido trivial, y su único elemento es precisamente el 
elemento seleccionado por y en el complemento del conjunto (Y de sus 
predecesores). Como un y-conjunto es un conjunto bien ordenado, su tipo 
de orden es un ordinal. Sean a£ y B los tipos de orden de los y—conjuntos 
(G.,<o) Y (Gp<p), respectivamente. Si O. < B, hay un morfismo inyecti- 

vo q: G, —> Gp (Apéndice II, Proposición 5). Supongamos que p(x) + 

x para algún x e G,. Entonces (x € G,:x + Q(x)) es una parte no vacía 
del conjunto bien ordenado G, y tiene, por ende, un primer elemento g.. 
Entonces U = (x € G¿¿X <yg O) = LQ(x):x EG, A OO) <y O(3)) = Y y, 
por definición, g, = Y(MNU) = Y(MNV) = Q(g,). Vemos así que (x e G.; 

x + Q(x)) = Y y que q(x) = x para cada x € G,. De suerte que G, € Gp 
y, como f es un morfismo, la relación <, concuerda en G, con <p Lla- 
maré M, al conjunto de todos los y-elementos de M (Zermelo lo llama L,, 
pero no veo la ventaja de introducir una letra nueva para este propósito). 
Sabíamos ya que M, + Y. Ahora hemos aprendido que M, es la unión de 
una secuencia, posiblemente transfinita, de y-conjuntos G,, G,, ... tales 
que G, ES G,C... Obsérvese, en particular, que G, = (y(M)), de modo 
que y(M) figura —como primer elemento— en cada y-conjunto. Sean a y 
b dos y-elementos y sea 0 el primer ordinal tal que (a,b € G,. Digamos 
que a < b si a <, b. Es claro que < determina un orden lineal en M,. Este 
orden es un buen orden. Para comprobarlo, consideremos un conjunto no 
vacío A C M, y un a € A. Sea ot el primer ordinal tal que a € G,. En- 
tonces (xEMyx< 4) CG, y siB=A NM (txeM,xs ay, < concuerda con 
la relación de buen orden <, en B < G,. Por lo tanto, (B,<) tiene un pri- 
mer elemento, que es también el primer elemento de (4,<). Vemos así que 
cualquier parte no vacía de M, tiene un primer elemento en el orden <. 
Por lo tanto (M,<) es un conjunto bien ordenado. Finalmente, probaré que 
M, = M. Sea M* = MMM, Si M* 4 9, podríamos extender el orden < a 
M, Y £1M*)) estipulando que para todo x € M,, x< y(M*). Entonces, 
evidentemente, M, U (y(M*)) sería un y-conjunto y y(M*) € M,, Como 
esto es imposible, dada la definición de M*, concluimos que M* = Y y 
que M es idéntico al conjunto bien ordenado M,. Como M es un conjunto 
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cualquiera, todo conjunto admite un buen orden. 

El supuesto AS que Zermelo destaca expresamente al final de su prueba 
se conoce desde entonces como el Axioma de Selección (alemán, Auswahls- 
axiom, francés, Axiome du Choix; inglés, Axiom of Choice).? Dice Zermelo al 
respecto: “Este principio lógico no puede derivarse de otro más simple, pero 
se aplica universalmente sin titubeos en el razonamiento matemático” (1904, 
p. 516). Vemos así que para establecer como un teorema lo que Cantor había 
llamado “una ley del pensamiento” Zermelo tiene que invocar un “principio 
lógico” que no figura en los escritos de Aristóteles, ni en las obras más 
recientes de Boole o de Frege. No sabría decir si el Axioma de Selección 
es más simple que el Teorema del Buen Orden. Lo que sí es claro es que 
la adopción de cualquiera de los dos como principio que no se demuestra 
permite demostrar al otro. El Teorema del Buen Orden se infiere del Axioma 
de Selección, como hemos visto, con un argumento sutil pero no difícil. El 
Axioma de Selección se deduce del Principio del Buen Orden de un modo 
brutalmente fácil: Sea H una colección de conjuntos no vacíos y < un buen 
orden en K = U%. Entonces k e % sólo si k < K y evidentemente hay un 
selector f: X => K que asigna a cada k e 3 un valor f(k) e k, a saber, la 
aplicación que asigna a k su primer elemento en (K,<). 

La demostración del Teorema del Buen Orden por Zermelo (1904) causó 
gran revuelo entre los especialistas y reacciones muy adversas, especialmente 
en Francia. Los ilustres matemáticos Borel y Lebesgue, que habían dado 
táctiamente por supuesto el Axioma de Selección en trabajos anteriores, lo 
declararon inadmisible cuando vieron que podía invocárselo para establecer 
la conclusión, a juicio suyo inverosímil, de que el continuo se deja ordenar 
bien. No puedo entrar aquí en los detalles de esta polémica, que G. H. Mo- 
ore analiza lúcidamente en su magistral historia del Axioma de Selección 
(1982). 

En respuesta a sus críticos, Zermelo produjo la “Nueva demostración de 
la posibilidad de un buen orden” (1908a). El artículo está dividido en dos 
partes que contienen la nueva demostración y un examen de las objeciones 
contra la demostración anterior, respectivamente. La segunda demostración 
depende del Axioma de Selección, como la primera, pero difiere de ella en 
cuanto ahora Zermelo evita cuidadosamente invocar resultados de la teoría 


Algunos autores de habla castellana prefieren decir *Axioma de Elección”. 
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cantoriana de los ordinales. Antes bien, al mostrar cómo se puede introducir 
un buen orden en cualquier conjunto M —dado un selector para P2MNXD) 
—Zermelo ilumina la estructura subyacente a esa teoría y prepara el terreno 
para su reformulación puramente conjuntista en términos de las relaciones 
e yc. 

La demostración va precedida del enunciado explícito de dos supuestos 
no demostrados: (1) Todos los elementos de un conjunto M que cumplen una 
condición bien definida £ forman un subconjunto (Untermenge) M, C M; el 
complemento MAM, también es un conjunto. (1) Todos los subconjuntos de 
un conjunto M forman un conjunto PM. Por cierto, la matemática conjuntista 
había hecho uso de estos supuestos sin formularlos. Como veremos en la 
Sección 1.8.1, ambos figuran en la lista de axiomas para la teoría de conjuntos 
que Zermelo publicó ese mismo año (1908a). El Teorema del Buen Orden se 
enuncia como una proposición hipotética: Un conjunto M es bien ordenable 
si hay un selector para P2MX(2D). Después de completar la prueba de la 
misma, Zermelo enuncia el Axioma de Selección, en virtud del cual es lícito 
desglosar la apódosis: Todo conjunto es bien ordenable. La argumentación 
de Zermelo se dirige a probar que si M es un conjunto no vacío y f es un 
selector para PMXXDy, hay un y sólo un M PM tal que (i) M está bien 
ordenado por la relación de inclusión propia *X € Y n X% Y” (“Y incluye 
a X, pero no es igual a X”), que simbolizaré *Y > X”, y (11) la restricción 
fu de f a MXX(D) es una biyección de MX(D) sobre M. Como es obvio, 
M está bien ordenado entonces por la relación < definida como sigue, para 
cualquier par de elementos x, y € M:x< y S fu "60 > fu'0»). (Decimos 
que de esta manera fy induce en M el buen orden de M).* 

Zermelo responde a objeciones formuladas por Borel y Peano, Poincaré, 
Philip Jourdain y Schoenflies. Me limitaré a considerar las primeras. Borel 
y Peano habían reclamado una prueba del Axioma de Selección. Zermelo 
responde que en matemáticas la indemostrabilidad no equivale a la invali- 
dez, pues, como es sabido, no todo se puede demostrar. Concede que “no 
puede forzar a nadie apodícticamente a reconocer” el Axioma, pero a la vez 
arguye que éste reúne los tres requisitos que, a su modo de ver, justifican la 
adopción de un postulado en matemáticas: (a) con frecuencia ha sido utili- 


> En el Apéndice V doy una paráfrasis de la segunda demostración del Teorema del 


Buen Orden por Zermelo. 
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zado tácitamente en diversos campos de la matemática y especialmente en 
teoría de conjuntos, (b) es evidente de suyo y (c) responde a una necesidad 
científica, pues son muchas las proposiciones importantes que sólo pueden 
demostrarse invocándolo. De estas tres condiciones sólo la tercera ha demos- 
trado tener verdadera fuerza. A la lista ofrecida por Zermelo de siete teoremas 
Importantes que no se pueden demostrar sin ayuda del Axioma, han venido 
a agregarse desde 1908 muchísimos más, al punto de que hoy por hoy el 
típico especialista en álgebra, topología o análisis diría que si lo privan del 
Axioma le están quitando el suelo bajo sus pies. Zermelo corona su respuesta 
con un devastador argumentum ad hominem: Peano no necesita el Axioma 
de Selección en su trabajo profesional debido a que el sistema lógico-mate- 
mático expuesto en su Formulaire des Mathématiques genera la paradoja de 
Russell, de la cual se puede deducir lo que a uno le dé la gana. 

Más significativa que la objeción de Peano me parece la de Poincaré. En 
una serie de tres artículos sobre “Las matemáticas y la lógica” (1905/1906), 
el gran matemático y filósofo francés descargó el peso de su autoridad y el 
fuego de su elocuencia a la vez sobre el conjuntismo de Cantor y sobre el 
logicismo de Peano, Russell y Couturat. Poincaré estima que estos programas 
de fundamentación de las matemáticas andan completamente extraviados. De 
ahí las paradojas que, a su modo de ver, aquejan a ambos por igual. Según 
Poincaré, las paradojas nacen del empleo de términos cuya definición envuel- 
ve una forma de circularidad qué él juzga viciosa. Así, el término “conjunto 
de todos los conjuntos que no son elementos de sí mismos” supuestamente 
denota un objeto caracterizado mediante una alusión a la totalidad de los 
conjuntos, uno de los cuales es precisamente ese objeto. Asímismo el ordinal 
de todos los ordinales, nombrado en la paradoja de Burali-Forti, se define 
por la expresión “todos los ordinales”, cuya extensión lo contiene. Caracte- 
rizar el término £ nombrando un determinado conjunto K tal que te K es 
como repetir el definiendum en el definiens, puesto que cualquier expresión 
que nombre a K = (x:x e Kj denota, entre otros, al objeto que se busca 
designar con £. Poincaré objetó a la primera prueba del Teorema del Buen 
Orden por Zermelo (1904) que la caracterización de los y-conjuntos, que 
figuran decisivamente en ella, peca de este vicio. Zermelo (1908a) no sólo 
reconoce que ello es así, sino que para explicar a sus lectores la objeción de 
Poincaré, cita un ejemplo tomado de su segunda prueba, a saber, el término 
M que designa la intersección de todas las f-cadenas de M, la cual —como 
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luego se prueba— es ella también una de esas f-cadenas (v. Apéndice V). 

Debido a un desplazamiento semántico que ya se manifiesta en este texto 
de Zermelo, las definiciones que Poincaré juzga circulares y los términos 
definidos por ellas suelen distinguirse con el epíteto 'no predicativo” o 
*“impredicativo”.* Zermelo observa que el uso de términos no predicativos 
es endémico en el análisis: ellos figuran en cada demostración “en que el 
máximo o el mínimo de un conjunto numérico “cerrado” definido previamente 
se utiliza para llegar a nuevas conclusiones. Así ocurre, por ejemplo, en la 
conocida prueba del Teorema Fundamental del Álgebra por Cauchy, sin que 
hasta ahora se le haya ocurrido a nadie hallar en ella algo ilógico” (Zermelo 
1908, p. 524). Y la verdad es que nadie reconocería un procedimiento falaz 
en la descripción de diciembre como “el último mes del año” o del perihelio 
de Mercurio como “el punto de la órbita de Mercurio que está más cerca 
del sol”. En un diccionario filosófico reciente, Christian Thiel, que milita 
entre los enemigos de la “impredicatividad”, amaña su definición para evi- 
tar los contraejemplos de este género. Impredicativo, según Thiel, es “un 


Russell (1906) llama “predicativa' a una condición (“función proposicional”) que de- 
termina un conjunto; “no predicativa”, entonces, es una que no logra hacerlo, como la 
condición *x es el conjunto de todos los conjuntos”. Poincaré (1905/1906) dice que “las 
definiciones que deben ser consideradas como no predicativas son aquellas que contie- 
nen un círculo vicioso” (CM, p. 147). Zermelo, que probablemente no había leído el 
artículo de Russell, da la impresión de entender que Poincaré en este pasaje —destacado 
en cursiva— está definiendo el término “definición no predicativa”. Poincaré acepta 
aparentemente esta interpretación en su “Logique de 1'infini” (1909), cuando distingue 
“dos especies de clasificaciones aplicables a los elementos de las colecciones infinitas: 
las clasificaciones predicativas, que no pueden ser quebrantadas por la introducción de 
nuevos elementos, y las clasificaciones no predicativas, que la introducción de nuevos 
elementos obliga a modificar incesantemente” (DP, p. 10). Doy más detalles sobre este 
asunto en el Capitulo 2.4. 


El Teorema Fundamental del Álgebra dice que todo polinomio de grado n > 1, con 
coeficientes complejos, a, + ax! +... + a,x”, tiene por lo menos una raíz (en el cuerpo 
C de los complejos). Un caso ejemplar de impredicatividad es la definición habitual del 
supremo o cota superior mínima de un conjunto K C |R: para todo x, z, y we R,x 
es el supremo de K si y sólo si (1) si w e K, entonces w € x, y (ii) si para cualquier 
we K, z2 w, entonces z > x. (El ínfimo o cota inferior máxima de K C R se define 
análogamente, mutatis mutandis). Buena parte del análisis clásico depende de un teo- 
rema que dice que todo conjunto de números reales que tiene una cota superior posee 
un supremo y todo conjunto de números reales que tiene una cota inferior posee un 
ínfimo. 


procedimiento para delimitar o caracterizar un objeto, que en la descripción 
del mismo hace referencia a una totalidad de objetos que ... comprendería 
al propio objeto en cuestión, y cuyos elementos no pueden todos generarse 
constructivamente” (cursiva mía).* Conforme a esta nueva definición, claro 
está, el vicio de impredicatividad no consiste en que se aduzca “circularmen- 
te”, para fijar la referencia a cierto objeto, una totalidad que lo presupone, 
sino más bien en que la totalidad en cuestión no satisface un requisito de 
construibilidad que habría que especificar y justificar. Como la matemática 
conjuntista no se deja imponer tales requisitos, el desacuerdo entre Poincaré 
y Zermelo nos sitúa, de hecho, en la línea divisoria entre dos grandes ver- 
tientes del pensamiento matemático del siglo XX. 


$ Mittlestraf, EPW, s.v. imprádikativ/Impriidikativitát. 


1.8 AXIOMAS PARA UNA TEORÍA DE CONJUNTOS 


1.8.1 Zermelo (1908) 


Respondiendo a la objeción de Peano contra su primera demostración del 
Teorema del Buen Orden, Zermelo observa que el sistema lógico-matemático 
de ese autor cae presa de la paradoja de Russell porque no distingue entre 
“conjunto” y “clase”. 


En cambio, como pronto mostraré en otro lugar, los partidarios de la teo- 
ría de los conjuntos como disciplina puramente matemática, que no está 
constreñida por los conceptos fundamentales de la lógica tradicional, son 
perfectamente capaces de evitar, mediante una apropiada especialización 
de sus axiomas, todas las “antinomias” conocidas hasta ahora. 

(Zermelo 1908, p. 115) 


El escrito anunciado apareció ese mismo año (Zermelo 1908a). Con él nace 
la teoría axiomática de conjuntos. 

La idea de una teoría axiomática procede de Aristóteles, para quien todo 
conocimiento científico propiamente tal (émwoTñiun) se establece por inferencia 
deductiva a partir de principios (4pxat) de dos clases, a saber, conceptos 
que no se definen y aseveraciones que no se demuestran. En la literatura 
filosófica posterior se los llama, respectivamente, “primitivos” y “axiomas”. 
Los primitivos no tienen que definirse porque cualquiera los entiende. No 
es posible, pero tampoco es preciso, demostrar los axiomas, porque son de 
suyo evidentes.' Tradicionalmente se ha visto en los Elementos de Euclides 
(publicados alrededor de un cuarto de siglo después de muerto Aristóteles) 
una realización ejemplar de esta idea de ciencia. No comparto esta opinión.? 


Aristóteles explica su idea de una ciencia deductiva en los Segundos Analíticos. Scholz 
(1930) ofrece una interpretación de esa obra a la luz de la axiomática moderna (en 
el estilo de Hilbert). Sobre esta materia, puede también consultarse mi artículo, “El 
método axiomático” (1993). 


2 Véase Torretti 1978, pp. 59. 
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A mi modo de ver, la concepción aristotélica de una ciencia edificada por 
deducción rigurosa sobre principios de suyo inteligibles o evidentes no 
vino a realizarse hasta 1882, en las Lecciones sobre geometría moderna de 
Moritz Pasch. 

La exposición sistemática de la geometría en el libro de Pasch parte de 
ciertos conceptos primitivos concernientes a la figura, tamaño y posición 
recíproca de los cuerpos. Dichos conceptos no se definen, pues ninguna 
definición podría sustituir a “la indicación de objetos naturales apropiados”, 
que es la única vía para entender nociones tan simples e irreductibles como 
éstas (Pasch 1882, p. 16). Todos los demás conceptos utilizados se definen 
en términos de los primitivos o de otros conceptos ya definidos. Los axiomas 
(Grundsditze) conectan los conceptos primitivos entre sí. Aseveran “lo que se 
observa en ciertas figuras muy simples” y su contenido geométrico no puede 
captarse aparte de esas figuras (1882, p. 43). Todas las demás aseveraciones 
de la geometría —sus “teoremas” (Lehrsátze)— se deducen de los axiomas 
o de teoremas ya deducidos. Así, “todo lo que se necesita para probar los 
teoremas tiene que estar consignado (niedergelegt), sin excepción, en los 
axiomas” (1882, p. 5). “Cada conclusión a la que se llega en una prueba tiene 
que hallar su confirmación en la figura, pero no se justifica por la figura sino 
por una determinada proposición (o definición) precedente” (1882, p. 43). 

En agudo contraste con el mismo Aristóteles y la larga tradición de sus 
intérpretes, Pasch comprendió a cabalidad las implicaciones de esta idea de 
una ciencia rigurosamente deductiva. 


De hecho, si la geometría ha de ser realmente deductiva, el proceso de 
inferencia debe ser siempre independiente del sentido de los conceptos 
geométricos, tal como debe ser independiente de las figuras. Sólo pueden 
considerarse las relaciones entre los conceptos geométricos consignadas 
en las proposiciones y definiciones utilizadas. Durante la deducción es sin 
duda lícito y útil pensar en el significado de los conceptos geométricos que 
se presentan, pero ello no es en absoluto necesario; de modo que cuando 
resulta indispensable, esto indica, justamente, que la deducción tiene lagu- 
nas y —si no es posible llenarlas modificando el razonamiento — que las 
proposiciones aducidas como medios de prueba son insuficientes. 

(Pasch 1882, p. 98) 


Este pasaje anticipa el nuevo giro que Hilbert le dará poco más tarde a la 
idea de una ciencia deductiva, y que inspirará, prácticamente sin rivales, todas 
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las axiomatizaciones de teorías matemáticas en el siglo XX. Si el significado 
de los conceptos primitivos —fijado intuitivamente por “indicación de objetos 
naturales apropiados” — nada contribuye a la justificación de los teoremas, 
la teoría deductiva en cuestión valdrá lo mismo para el sistema de objetos 
indicado que para cualquier otro sistema de objetos cuyas relaciones mutuas 
satisfagan las condiciones estipuladas en los axiomas. Así, por ejemplo, la 
teoría del espacio euclidiano axiomatizada por Hilbert retiene todo su valor 
si se entiende que un “punto” es un trío ordenado de números reales, que 
una “recta” o un “plano” es un cierto conjunto de “puntos” que satisfacen 
un cierto tipo de ecuaciones, se interpretan los otros primitivos de Hilbert 
de un modo apropiado —por ejemplo, el “punto” x = (x,,x,,x,) “incide” en 
el plano Tr, si los números x,, x, y x, forman una solución del sistema de 
ecuaciones lineales constitutivo de T— y se define la “distancia” g(v,u) entre 
dos “puntos” y = (v,,v,,V,) y U = (u,,u,u,) por la relación pitagórica 


a 1/2 
Ó(v,u)= (Lo uy) 


i=l 
Como Hilbert le explica a Frege el 29 de diciembre de 1899: 


Naturalmente, cada teoría es sólo un andamiaje (Fachwerk) o esquema de 
conceptos con sus necesarias relaciones mutuas, y los elementos básicos 
pueden pensarse como se quiera (in beliebiger Weise). Si pienso que mis 
puntos son cualquier sistema de cosas, vgr. el sistema amor, ley, des- 
hollinador, ..., con que luego sólo postule la totalidad de mis axiomas 
como relaciones entre estas cosas, mis teoremas —el de Pitágoras, por 
ejemplo— valen también para ellas. En otras palabras: cada teoría puede 
siempre aplicarse a infinitos sistemas de elementos básicos. Basta aplicar 
una transformación unívoca invertible [una biyección—R.T.] y estipular 
que los axiomas homólogos valen para las transformadas. 

[Hilbert a Frege, 29.12.1899, en Frege, WB, p. 67] 


Las lúcidas observaciones de Pasch y Hilbert que he citado dan al traste 
con la idea de Gergonne (1818), repetida por varios autores a comienzos de 
este siglo, según la cual los axiomas de una teoría proveen una definición 
implícita de sus primitivos. De hecho, es muy poco o nada lo que los axiomas 
pueden decir acerca de la índole de los objetos que los primitivos denotan. 
Es claro, en cambio, que los axiomas definen explícitamente una clase de 
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objetos complejos, a la que pertenece cada sistema de elementos básicos que 
cumple con las condiciones estipuladas por ellos. Si a una lista de axiomas 
compatibles entre sí viene a agregarse otro que no es una consecuencia de los 
anteriores, la clase definida se restringe. (En particular, si el nuevo axioma 
es incompatible con los demás, la clase definida se reduce a WM). Cuando se 
habla de “especializar” los axiomas de una disciplina matemática, uno pen- 
saría normalmente que se trata de restringir de este modo el alcance de sus 
aplicaciones potenciales. Por ejemplo, si eliminamos el Axioma IV (Axioma 
de las Paralelas) de la lista propuesta en Los fundamentos de la geometría 
de Hilbert (1899), la clase de objetos complejos caracterizada por la teoría 
resultante incluye todos los ejemplos concebibles de espacio euclidiano y 
todos los ejemplos concebibles de espacio de Lobachevsky (entiéndase: de 
tres dimensiones). Al agregar el Axioma IV la teoría se especializa y deja 
de ser aplicable a los espacios de Lobachevsky.* En cambio, la teoría obte- 
nida agregando la negación del Axioma IV caracteriza precisamente a los 
espacios de Lobachevsky y no es aplicable a los euclidianos. Por último, si 
agregamos a los Axiomas III y V de Hilbert tanto el Axioma IV como su 
negación, obtenemos una teoría tan especializada que no podría haber nada 
a lo que fuese aplicable. Sorprende, pues, que Zermelo pretendiese limpiar 
de contradicciones a la teoría de conjuntos por la vía de especializar sus 
axiomas. 

Aunque influida por la obra de Hilbert, la teoría axiomática de conjuntos 
de Zermelo tiene características peculiares, impuestas por la naturaleza de 
su tema. Una que salta a la vista concierne a la manera de referirse a éste. 
Normalmente, una teoría axiomática se refiere a uno o más conjuntos de 
objetos, cuyos atributos y relaciones son caracterizados por los axiomas.* 
Pero como la teoría de Zermelo intenta justamente caracterizar el atributo de 
ser un conjunto no puede invocarlo de entrada al acotar su tema. Leemos, 
por eso, que “la teoría de conjuntos concierne a un “dominio” *B de objetos 


El Axioma IV de Hilbert dice que si a es una recta cualquiera y A es un punto fuera 
de a, en el plano determinado por a y A hay a lo sumo una recta que pasa por a y no 
intersecta a A. El Axioma IV es falso en un espacio de Lobachevsky. En tal espacio 
no hay rectángulos y el cuarto ángulo de un cuadrilátero con tres ángulos rectos es 
siempre agudo. 

Hilbert invita al lector a concebir “tres sistemas de cosas” (que llama “puntos”, “rectas” 
y “planos”), donde —como señalé en la nota 3 del Capitulo 1.2— “sistema” (System) 
es el término que usaba Dedekind en lugar de “conjunto” (Menge). 
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que simplemente llamamos “cosas”, una parte de las cuales está formada 
por los *conjuntos”.”* Para comprender esta oración no tenemos que saber 
lo que significa la palabra “conjunto”, ya que esto es lo que los axiomas 
buscan determinar, pero ciertamente tenemos que entender la frase “dominio 
de objetos”. Ahora bien, se preguntará el lector ¿no denota esta frase exac- 
tamente lo que hasta aquí, siguiendo a Cantor, hemos llamado “conjunto”? 
¿asistimos, entonces, a un acto de prestidigitación verbal? En la Sección 
1.8.5 presentaré la profunda y original respuesta a tales preguntas que años 
más tarde ofrecerá Zermelo (1930). Pero por ahora podemos encarar este 
asunto así: la expresión “el conjunto K”, en su acepción cantoriana, designa 
colectivamente a los elementos de K; en cambio, la frase “el dominio Y” 
designa distributivamente a las cosas cuyos atributos y relaciones Zermelo 
busca caracterizar con sus axiomas. En efecto, si “el dominio Y” designase 
un objeto formado por esas cosas, se podría discernir en Y otro objeto €, 
formado por aquellas cosas de $ que son conjuntos; entonces €, no importa 
como se lo describa, sería en efecto el conjunto de todos los conjuntos, cuya 
existencia es contradictoria. 

Otra diferencia notoria entre la teoría de Zermelo y las axiomáticas habi- 
tuales concierne al número y complejidad de los primitivos. Mientras la 
geometría de Hilbert tiene ocho, a saber, tres predicados monádicos (“pun- 
to”, “recta”, “plano”), cuatro diádicos (dos especies de incidencia y dos de 
congruencia) y uno triádico (“el punto x está entre los puntos z y w”), la 
teoría de Zermelo sólo tiene un predicado monádico, 'x es un conjunto”, y 
uno diádico, íx es un elemento del conjunto y” (simbolizado 'x e y”). Entre 
esos ocho primitivos, los axiomas de Hilbert postulan relaciones sumamente 
complejas, las cuales caracterizan su dominio con tal precisión que, a fin 
de cuentas, cualquier modelo (realización) de la geometría de Hilbert es iso- 
mórfico? a cualquier otro. Si una teoría axiomática posee esta propiedad se 
dice que es monomórfica o categórica. La teoría de Zermelo no es categórica, 


“Die Mengenlehre hat zu tun mit einem “Bereich” * von Objekten, die wir einfach 
als “Dinge” bezeichnen wollen, unter denen die “Mengen” einen Teil bilden” (Zermelo 
1908a, p. 262). En virtud del Axioma II si a es una “cosa” del dominio Y hay en Y 
por lo menos un conjunto k tal que a e k. Así, pues, todas las “cosas” de que habla 
la teoría axiomática de Zermelo son elementos de conjuntos. Aquéllas que no son con- 
juntos a su vez se conocen en la literatura matemática como Urelemente (“elementos 
primordiales”). 
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y podría pensarse por ello que ofrece una caracterización insuficiente de su 
tema. Para muchos éste es un defecto de la teoría axiomática de conjuntos 
que Fraenkel intentará subsanar pero que según Skolem y von Neumann no 
tiene remedio. Por su parte, Zermelo (1930) sostendrá que la no-categorici- 
dad es una virtud imprescindible en una teoría que pretende enmarcar la 
matemática entera.* 

En el Apéndice VI doy una traducción de los axiomas de Zermelo. Aquí 
comentaré su alcance, en parte citándolos, en parte parafraseándolos. Ante 
todo, quiero llamar la atención sobre un hecho notable: salvo el Axioma l, 
todos los axiomas de Zermelo son asertos de existencia, ya sea absolutos, 
ya sea condicionales: los Axiomas II y VII aseveran que en el dominio Y 
hay un conjunto de cierta índole; los Axiomas II-VI aseveran que, si en Y 
hay ciertos objetos o conjuntos, también hay en Y ciertos otros conjuntos 
que cumplen ciertas condiciones con respecto a aquéllos. Los asertos de 
existencia son frecuentes en todas las teorías axiomáticas, pero éstas in- 
cluyen también lo que —por analogía con la física— cabe llamar “leyes”, 
esto es, axiomas que postulan que si unos objetos del dominio cumplen 
una condición, también cumplen otra.? Parecería que sin tales “leyes” no 
se puede especificar la naturaleza del dominio de la teoría. La única “ley” 
entre los axiomas de Zermelo es el Axioma I (Axioma de Determinación), 
en virtud del cual la identidad de un conjunto sólo depende de sus elemen- 
tos. También tiene este carácter la indicación preliminar de que, con la sola 
excepción expresada en el Axioma II, una cosa a es un conjunto si y sólo 


“Nuestro sistema de axiomas justamente es no-categórico, lo que en este caso no es 
un inconveniente, sino una ventaja. Pues precisamente sobre este hecho descansa la 
enorme significación y la aplicabilidad ilimitada de la teoría de conjuntos en general” 
(Zermelo 1930, p. 45). Zermelo se refiere aquí a su sistema ZF* de 1930, pero el pasaje 
también es aplicable al sistema de 1908a. 


El Axioma Í 8 de Hilbert es un buen ejemplo de aserto existencial absoluto: “Hay por 
lo menos cuatro puntos que no están todos en un mismo plano”. El Axioma IT 2 es 
un aserto existencial condicional: “Dados dos puntos A y C, hay siempre un punto B 
sobre la recta AC tal que C está entre A y B.” Entre los 18 primeros axiomas de Hilbert 
sólo siete no son asertos de existencia: los Axiomas I 5 y II 3 niegan la existencia de 
ciertos objetos; los Axiomas 1 6, II 1, 111 2, III 3 y III 5 afirman que ciertas relaciones 
subsisten cada vez que se cumplen ciertas relaciones. Los dos axiomas restantes son 
peculiares. El Axioma V afirma que, dados dos segmentos rectos o. y P, tales que 
a. < B, siempre hay un número entero n tal que B < no.. Se trata pues de un aserto 
existencial, pero, como n no es un punto, una recta, o un plano, lo que V 1 asevera 
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si hay una cosa b tal que b e a (Zermelo 1908, p. 262, $1.2). Eso es todo 
lo que la teoría nos brinda para visualizar qué podría ser un “conjunto” y en 
qué consiste la relación “e”. 

Los asertos existenciales absolutos establecen el contenido mínimo del 
dominio Y. 

Conforme al Axioma II (Axioma de los Conjuntos Elementales), hay un 
conjunto tal que no contiene elementos, “el conjunto cero”, simbolizado 
“0”. Me parece justificado identificarlo sin más con el conjunto vacío Y. 
Obsérvese que lo que aquí se está diciendo es (a) que hay en MB (por lo 
menos) una cosa, (b) que (por lo menos) una de las cosas que hay en 4 no 
contiene elementos, y (c) que no obstante la característica general atribuida 
a los conjuntos por la indicación preliminar ($ 1.2), cierta cosa (2 que no 
contiene elementos será tratada como conjunto en nuestro discurso. Evi- 
dentemente, como la identidad de un conjunto depende de sus elementos 
(Axioma l), este privilegio no puede conferirse más que a una sola cosa. 
Completan el Axioma II dos aseveraciones condicionales: si hay en Y una 
cosa cualquiera a, entonces también hay en Y un conjunto La), cuyo único 
elemento es a; si hay en Y dos cosas a y b, entonces también hay en Y un 
conjunto (a,bj, cuyo únicos elementos son a y b. 

Conforme al Axioma VII (Axioma del Infinito), hay en Y por lo menos un 
conjunto Z tal que (1) Y e Z y (ii) si a e Z, La) e Z. Invocando el Axioma 
TIL, Zermelo demuestra que existe en Y un cierto conjunto Z, —que es la 
parte común a todos los conjuntos Z que cumplen la condición del Axioma 
VI— cuyos elementos son 41, (0D), «DP», ... Zermelo propone llamar a 
Z, “la serie numérica”, porque sus elementos puede hacer las veces de nú- 
meros. “Constituye el ejemplo más simple de un conjunto “enumerablemente 
infinito”” (Zermelo 1908, p. 267). 

Los asertos existenciales condicionales postulan una expansión colosal 
del contenido de Y. 

Como vimos, si hay dos cosas distintas, a y b, las cláusulas condicionales 
del Axioma Il certifican la existencia de los infinitos conjuntos (aj, Lay, 


AA 0 AD, BADIA ++ ay, La by), ay, ía,byy, etc. 


es la existencia de un objeto ajeno al dominio de la teoría. También el Axioma V 2 
(trascrito más adelante en la nota 27) trasciende el dominio de la teoría, pues dice que 
fuera de él no hay otros objetos con los cuales se lo pueda ampliar para constituir un 
dominio más rico en que también se cumplan los axiomas. 
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En virtud del Axioma III (Axioma de Separación), los elementos de un 
conjunto a existente en B que cumplen una condición bien definida P forman 
un conjunto separado existente en , el subconjunto (x: x e a a Pxj. Para 
que este axioma tenga un significado preciso hay que determinar qué es una 
condición bien definida (definit). Zermelo lo explica así: 


Una cuestión o proposición (4, cuya validez o invalidez deciden sin arbi- 
trariedad las relaciones fundamentales del dominio [esto es, las relaciones 
de la forma a e b] en virtud de los axiomas y de las leyes lógicas uni- 
versalmente válidas se llama “bien definida” [“definit”]. Asímismo, una 
proposición universal E(x), en la cual el término variable x puede recorrer 
todos los individuos de una clase $, se dice “bien definida” si está bien 
definida para cada individuo de la clase $. Así, la cuestión de si a e b 
o no está siempre bien definida; también la cuestión de si M < No no. 

(Zermelo 1908a, p. 263) 


Aunque a primera vista parece que la frase “deciden sin arbitrariedad” (ohne 
Willkiir entscheiden) no es suficientemente precisa (Weyl 1910, p. 304), 
una breve reflexión permite extraer del pasaje citado la siguiente definición 
recursiva: Una condición P está bien definida (a) si P expresa la presencia 
o ausencia de la relación e entre dos cosas; (b) si P se refiere a todas las 
cosas que cumplen una cierta condición bien definida con respecto a cada una 
de ellas; o (c) si P se infiere de otras condiciones bien definidas, en virtud 
de los Axiomas I-VIT y de las leyes de la lógica.* Cabe todavía preguntarse 
qué hay que entender aquí por “leyes de la lógica”. Como veremos en la 
Sección 1.8.2, Skolem (1922) dará a esta pregunta una respuesta radical que 
ha tenido mucha aceptación. 

El Axioma IV (Axioma del Conjunto Potencia) dice que si 7 es un con- 
junto existente en VB, también existe en YB el conjunto potencia PT cuyos 
elementos son todos los subconjuntos de T. Combinado con el Axioma VII, 
que postula la existencia en Y de un conjunto infinito (enumerable), el 
Axioma IV asegura la existencia en $ de conjuntos indenumerables cuyos 


Apliquemos esta definición a los ejemplos de “cuestión bien definida” propuestos por 
Zermelo. 'a e b” está siempre bien definida en virtud de (a). 'M C N” abrevia la 
condición Vx(x e M > x € N), la cual está bien definida en virtud de (b), ya que 
“x e N' —en virtud de (a)— y por ende x e M> x € N” —en virtud de (c)— son 
condiciones bien definidas para toda cosa x. 
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cardinales son 2%, 22... 

El Axioma V (Axioma de Unión) dice que si 7 es un conjunto existente 
en YB, también existe en Y el conjunto unión UT formado por todos los 
elementos de los elementos de T. 

El Axioma VI es el Axioma de Selección. Formalmente: si T es un conjunto 
existente en Y cuyos elementos son conjuntos no vacíos y mutuamente dis- 
juntos (esto es, si u € T implica que Jw(w e u) yu e Ta ve T implica 
que u =v vw un v= Y), el conjunto unión UT incluye un subconjunto s 
que tiene un y sólo un elemento en común con cada elemento de T.? Infor- 
malmente, esto equivale a decir que si 7 cumple la condición indicada, es 
posible seleccionar un y sólo un elemento de cada elemento de T, y formar 
con los objetos así seleccionados un conjunto s. 

De los siete axiomas citados Zermelo infiere los principales teoremas de la 
teoría de los cardinales transfinitos (1908a, $ 2 “Teoría de la equivalencia”). 
La teoría de los ordinales, cuya publicación anuncia (p. 262), y que se sabe 
que completó hacia 1914, no llegó a publicarse. 

Se ha solido decir que Zermelo elaboró su teoría axiomática de conjun- 
tos con el propósito de eludir las paradojas. G. H. Moore sostiene que esta 
opinión tradicional contiene a lo sumo “una migaja de verdad” (1982, p. 
157), pero que Zermelo obró motivado sobre todo por el deseo de responder 
a los críticos de su primera prueba del Teorema del Buen Orden, para lo 
cual necesitaba determinar con toda precisión los supuestos requeridos para 
demostrarlo. Como no he tenido acceso a la correspondencia u otros papeles 
privados de Zermelo, no puedo cuestionar este aserto de Moore. Lo que 
no admite duda es que Zermelo ofreció al público su axiomatización como 
el método apropiado para reconstruir la teoría de Cantor sin paradojas. Lo 
dice el anuncio de Zermelo 1908a en Zermelo 1908 (citado al comienzo de 
esta sección) y lo confirma ampliamente la introducción de Zermelo 1908a. 
Leemos allí que la “Antinomia de Russell” relativa al “conjunto de todos 
los conjuntos que no se contienen a sí mismos” nos fuerza a restringir la 
definición cantoriana de conjunto como una “reunión en un todo de determi- 
nados objetos bien distinguidos de nuestra intuición o nuestro pensamiento”, 
aunque “todavía no se ha logrado reemplazarla con otra, igualmente simple, 


La apódosis del Axioma VI se puede expresar con más claridad así: 


3s(s E UT A Vulu € T>5(uNns:DaA VxVy((x y) cu ms >x= y))) 
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que no dé lugar a tales dudas” (1908a, p. 261). 


En estas circunstancias no queda en la actualidad otro recurso que em- 
prender el camino al revés y, partiendo de la “teoría de conjuntos” his- 
tóricamente dada, buscar los principios que se requieren para fundamentar 
esta disciplina matemática. Esta tarea debe resolverse de tal modo que los 
principios se restrinjan lo suficiente para excluir todas las contradicciones, 
pero a la vez sean lo bastante amplios para retener todo lo que hay de 
valioso en dicha teoría. 

(Zermelo 1908a, p. 261) 


Zermelo estima que sus siete axiomas cumplen este propósito. Confiesa que 
no ha podido aún demostrar rigurosamente su consistencia (Widerspruchs- 
losigkeit), pero subraya que “todas las “antinomias” conocidas hasta ahora 
desaparecen en cuanto se adoptan como base los principios aquí propuestos” 
(1908a, p. 262). 


1.8.2 ¿Qué está “bien definido”? 


Cuando Zermelo publica sus axiomas en 1908, ya está en marcha el es- 
fuerzo iniciado por Frege y Peano para introducir precisión y claridad en el 
pensamiento matemático reformulándolo en un lenguaje artificial de sintaxis 
austera y rigurosa. Esta empresa intelectual, a la que me refiero en la Segun- 
da Parte, tuvo una marcada influencia en el desarrollo ulterior de la teoría 
axiomática de conjuntos. Ello no obstante, y a riesgo de adelantar ideas que 
debo explicar allí, me ha parecido oportuno cerrar esta Primera Parte con 
una descripción sumaria de las principales innovaciones que median entre el 
primer sistema axiomático de Zermelo (1908a) y los sistemas ZF (Zermelo- 
Fraenkel) y NGB (von Neumann-Gódel-Bernays) utilizados corrientemente 
en la enseñanza y la investigación. 

En la conferencia “Sobre las definiciones de los conceptos matemáticos 
fundamentales”, dictada en Zurich al obtener la venia legendi, Weyl (1910) 
expresa reservas frente a la noción de lo “bien definido” (definit) invocada 
en el Axioma III de Zermelo, cuya caracterización parafrasea así: 
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Una proposición bien definida es una proposición tal que su verdad o 
falsedad se puede decidir únivocamente y sin arbitrariedad sobre la base 
de las relaciones fundamentales e que subsisten entre las cosas de la 
teoría de conjuntos. 

(Weyl 1910, p. 304) 


Weyl observa con razón que hablar de una “decisión unívoca y exenta de 
arbitrariedad” es un tanto vago, y propone en cambio una definición re- 
cursiva más precisa pero posiblemente más estrecha que la que extraje del 
texto original de Zermelo en la Sección 1.8.1. De hecho, Weyl no llega a 
formular tal definición, sino que nos invita a construirla por analogía con 
ciertos “principios de definición” de los conceptos geométricos enunciados 
en la misma conferencia (1910, pp. 299s.). Es lo que intento a continuación. 
(El importante concepto de definición recursiva se explica en el Apéndice 
VIII. En el siguiente ejemplo, la cláusula señalada con el índice O constituye 
la base de la recursión): 


(0) 


(1) 
(2) 


(3) 


(4) 


(5) 


(6) 


Toda proposición de la forma 'x e y” está bien definida, cualesquiera 
que sean los términos x e y. 

Si q está bien definida, también lo está su negación 0. 

Si q y V están bien definidas, también lo está su conjunción 
PAY. 

Si Q(QA,,..., 01) es una proposición bien definida, referente al 
v-tuplo de cosas (0L,,..., 0), y O designa una permutación de 
(1,...,v), entonces la proposición e(0,;,... , 0), referente al 
v-tuplo (0, . . . , 0), también está bien definida. 

Si p(A,,..., 0.) está bien definida, y VEW(O0L,,..., 0, E) es ver- 
dadera si y sólo si (0, ... , 01, ) es verdadera, entonces y(0L,,...., 
OL, 0L,,,) está bien definida cualquiera que sea la cosa designada 
por OL,,1- 

Si p(E,,...., E) está bien definida, y y(0,,...., 0.,,) es verdadera 
si y sólo si JEp(0,,... , 0, 5) es verdadera, y(0.,,..., OL, ,) está 
bien definida. 

es una proposición bien definida si y sólo si es posible caracteri- 
zarla como tal mediante un número finito de aplicaciones de las 
seis reglas precedentes. 
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En 1910 Weyl todavía estaba dispuesto a decir que la matemática, al menos 
en lo que respecta a su “contenido lógico”, es “la ciencia de e y de aquellas 
relaciones que se dejan definir sobre la base de este concepto conforme a 
los principios antedichos” (1910, p. 304). Advierte, con todo, una dificultad 
para esta manera de ver en el hecho siguiente: al hablar de “un número fi- 
nito de aplicaciones” de ciertos “principios de definición”, tratamos a dichos 
principios “como cosas enumerables en el sentido de la teoría de conjun- 
tos”; así, estamos presuponiendo esta teoría en la explicación misma de los 
axiomas en que pretendemos basarla. En 1917, en su monografía sobre El 
continuo, reconoce que no ha podido resolver esta dificultad y cambia de 
punto de vista: 


El intento de adoptar estos principios [de definición] como axiomas para 
la formación de conjuntos y de expresar la exigencia de que no existan 
más conjuntos que los que pueden formarse mediante la aplicación, un 
número finito de veces, de los principios de construcción contenidos en los 
axiomas, todo ello sin presuponer el concepto de los números naturales, 
me condujo a una vasta y cada vez más compleja formalización, sin que 
lograra un resultado definitivo. Sólo en conexión con ciertos conocimientos 
filosóficos generales [...] se me hizo claro que perseguía un pseudo- 
problema escolástico, y alcancé el firme convencimiento [ ... ] de que la 
representación de la iteración, de la serie natural de los números, es un 
fundamento último del pensamiento matemático. [...] Si es verdad que 
los conceptos fundamentales de la teoría de conjuntos sólo pueden captarse 
llevando a cabo esta intuición “pura”, es superfluo y confundidor basar a 
su vez el concepto de número natural en la teoría de conjuntos. 

(Weyl 1918, pp. 36-37) 


En El continuo, Weyl ensaya una filosofía construccionista a medio cami- 
no entre la ortodoxia conjuntista a que adhería en 1910 y el intuicionismo 
brouweriano que abrazará públicamente en 1921. Esta obra cae fuera de los 
límites del presente estudio. En cambio, debemos atender a varias formas 
de definir definit surgidas en los años 20 dentro de la corriente central del 
pensamiento matemático. Aunque todas son variantes de la idea propuesta 
por Weyl en 1910, los autores que voy a citar deben haberla redescubierto 
independientemente, puesto que no reconocen su deuda con él. 

Fraenkel (1922a) demuestra que el Axioma de Selección es independiente 
de los otros seis axiomas postulados por Zermelo (1908a).'” Para ello nece- 


1.8 Axiomas para una teoría de conjuntos 83 


sita una formulación precisa del Axioma de Separación, que en el escrito de 
Zermelo “contiene la imprecisa noción definit.” Fraenkel se vale en cambio 
de un concepto de función que, parafraseando sus palabras, puede caracte- 
rizarse así: Sea x un elemento cualquiera de un dado conjunto K; entonces 
p(x) es el objeto que se forma aplicando un número finito de veces los 
Axiomas H-VI al objeto “variable” x y posiblemente también a otros objetos 
dados —“constantes”— a,,..., 4, La regla que gobierna dicha aplicación 
de los Axiomas I-VI es la función designada con la letra q. Por ejemplo, 
v0) = UK, (DY, Px U K0D)++. Fraenkel subraya que este concepto 
“no incluye ninguna noción general de función o correspondencia ni otra 
noción fundamental nueva” (1922a, en Heijenoort 1967, p. 286). Mediante 
este concepto el Axioma de Separación puede reformularse así: 


AxIoMA IM. Si M es un conjunto y y Y son dos funciones definidas en 
ese orden, M incluye (1) un subconjunto M que contiene pre- 
cisamente todos los elementos x e M tales que p(x) e y(x) y 
ningún otro elemento; así como (ii) un subconjunto M_¿ que 
contiene precisamente todos los elementos x e M tales que p(x) 
£ W(Qx) y ningún otro elemento. 


Por cierto, en la prueba de la independencia del Axioma VI se sobreentien- 
de que las funciones y Y mencionadas en el Axioma III sólo envuelven 
aplicaciones de los Axiomas I-V.'" 

Zermelo (1929) considera que esta nueva versión de su Axioma Ill es obje- 
table porque emplea la expresión “un número finito de veces” en la definición 
de “función”. Ve aquí un vicio de circularidad, puesto que el concepto mismo 
de número debiera fundarse en la teoría axiomática de conjuntos. Zerme- 
lo concuerda en esto con la autocrítica de Weyl, mas no por ello depone 
sus convicciones conjuntistas. Antes bien, mantiene la versión original del 
Axioma III, suplementándola con lo que describe como una caracterización 


pa Una proposición P es independiente de un conjunto de proposiciones F si P no es 
una consecuencia lógica de . Como toda proposición es una consecuencia lógica de 
S si F es inconsistente, la tesis de que P es independiente de $ se entiende siempre 
sujeta a la condición tácita de que F sea consistente. 


de En el Apéndice VII bosquejo la prueba de que el Axioma VI de Zermelo es indepen- 
diente de los Axiomas I-V y VII (Fraenkel 1922a). 
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axiomática del concepto definit. De hecho lo que nos da es una definición 
recursiva, suplementada por un curioso “axioma de completud” calcado sobre 
el Axioma V 2 de los Fundamentos de la geometría de Hilbert.'? 

Antes de enunciar la definición de “definit”, Zermelo prescribe una exi- 
gencia que este concepto debe satisfacer. Una lista de axiomas A —dice— 
determina un “sistema lógicamente cerrado”, esto es, un sistema S de 
proposiciones que pueden derivarse de A de un modo puramente lógico. Si 
A es consistente “tiene también que ser “realizable”, es decir, representable 
mediante un “modelo”, una matriz completa de las “relaciones fundamenta- 
les” que figuran en [S)” (Zermelo 1929, p. 341). Ahora bien, si r(x,,... ,x,) 
es una de las relaciones fundamentales que figuran en el sistema S y B es 
el dominio de elementos de un tal modelo de A, entonces tiene que estar 
decidido para cualquier lista (a,, ... ,a,) de objetos de B si vale para ella la 
relación r o bien su negación —r. 


Una tal propiedad o relación decidida (entschiedene) en cada modelo por 
las relaciones fundamentales es lo que se quiso designar con la expresión 
“definif” en [Zermelo 1908a]. “Definit” es, pues, lo que está decidido en 
cada modelo particular, pero puede estarlo de distinta manera en distintos 
modelos. La “decisión” se refiere al modelo particular; la “definición” 
(Definitheit”) misma a la relación considerada y al sistema total. 
(Zermelo 1929, p. 341) 


La definición de *definit' va precedida de una estipulación terminológica que 
me parece oscura y parafrasearé según mis luces: 


Sea 4 un dominio (que puede constar de varios subdominios mu- 
tuamente exclusivos YB,,..., Y,,). Sea H un sistema de relaciones 
fundamentales de la forma r(x,, ...., x,), donde las variables x,,...., 


12 En la nota 27 cito el Axioma V 2 de Hilbert. El “axioma de completud” de Zermelo 
dice así: 


AxIoMA III. Si P es el sistema de todas las proposiciones “bien definidas” o, 
más generalmente, si es cualquier sistema de proposiciones p de la índole Dp, 
P no incluye ningún subsistema propio P, que contenga todas las relaciones 
fundamentales de R y además comprenda todas las negaciones, conjunciones, 
disyunciones y generalizaciones de las proposiciones o funciones proposicionales 
contenidas en él. 

(Zermelo 1929, p. 344) 
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x, recorren el dominio Y (pudiendo también restringirse el recorrido 
de cada variable x, a uno solo de los subdominios de Y).'* 


Zermelo propone escribir De en lugar de la expresión “la proposición q está 
bien definida con respecto a NR” que define recursivamente así: 


O. Si r(x,...., x,) es una expresión en la cual r designa una relación 
n-aria del sistema HR y x,,..., x, son variables con recorrido en 
2, entonces Dr(x,,...., X,). 

1. Si De, entonces también D=0. 

Si Dq y Dv, entonces D(p A Y) y D(Q v v). 

En Si Df(x,,..., x,) para todos los valores admisibles de las variables 
Xp...» Xx, entonces DVx, ... Vx,f(x,...., x,) y también, por lo 
tanto, DJx, ... Ix,f(X,,...,x,). 

4, Si DF(f) para todo functor bien definido f = f(x,,.... x,), entonces 


DVfE(f) y DAFE(f). 


Hoy llamamos “functor n—ádico” a un símbolo que, acompañado de n términos 
(esto es, expresiones gramaticalmente aptas para designar objetos), forma un 
nuevo término. Por ejemplo, “log? es un functor monádico que, junto a un 
término que designe un número, forma un término que designa el logaritmo 
de ese número; “+” es un functor diádico que, acompañado de términos que 
designen dos números, forma un término que designa la suma de esos dos 
números. No me parece que en la cláusula 4 “functor” pueda entenderse en 


10 He aquí una traducción literal del texto de Zermelo: “Suponemos dado un domi- 
nio B (o en general una pluralidad de dominios B,, B,,...) así como una sistema 
R de relaciones fundamentales de la forma r(x, y, z,...), donde las variables x, y, 
Z, - - . pertenecen respectivamente a los dominios B” (1929, p. 342). En el simbolismo 
matemático actual, las expresiones “B,, B,,...” y “x, y, z,...” indicarían que Zermelo 
está hablando de unas secuencias infinitas de dominios y de variables. En tal caso, 
las generalizaciones universales y existenciales a que se refiere la cláusula 11.3 de la 
definición de *definit” irían precedidas por infinitos cuantificadores. Pero no creo que 
Zermelo haya contemplado aquí tan inusitada formación sintáctica. Tampoco creo que 
haya pretendido establecer una correspondencia biunívoca entre su lista de variables 
y su lista de dominios, como sugiere la frase “las variables x, y, z,... pertenecen 
respectivamente a los dominios B”. Por otra parte, no habría inconveniente en admitir 
una partición del dominio Y en infinitos subdominios, y sólo en aras de la brevedad 
he omitido mencionar esta posibilidad en mi paráfrasis. 
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esta acepción. Significa más bien lo que hoy llamaríamos un predicado, esto 
es, un símbolo que, acompañado de un número idóneo de términos, forma 
una proposición. Así, lo que esa cláusula nos está diciendo es que se puede 
formar una proposición bien definida cuantificando sobre variables predica- 
tivas. Ello implica que la teoría de conjuntos no se deja formalizar en un 
cálculo predicativo de primer orden.'* 

La misma revista — Fundamenta Mathematicae— en que apareció el 
artículo de Zermelo (1929) publicó poco después una nota polémica de 
Thoralf Skolem (1930). Skolem observa que la definición de “definit” pro- 
puesta por Zermelo, en la medida en que es aceptable, equivale a la suya, 
publicada mucho antes (Skolem 1922), y se sorprende de que Zermelo no la 
mencione. Conforme a la definición de Skolem, una aseveración bien defi- 
nida (eine definite Aussage) es cualquier expresión finita construida a partir 
de aseveraciones elementales de la forma a e b, o a = b, mediante una o 
más de las cinco operaciones siguientes: conjunción, disyunción, negación, 
cuantificación universal —“validez en cada caso”— y cuantificación exis- 
tencial —“validez al menos en un caso” (Skolem, SWL, p. 139).!* En otras 
palabras, una aseveración bien definida es una aseveración bien formada de 
un cálculo predicativo de primer orden con identidad y un primitivo único, 
el predicado diádico “e”. Al permitir la cuantificación sobre funciones pro- 
posicionales, la cláusula 4 de la definición de Zermelo ciertamente asigna a 
“definit” una extensión más amplia que la definición de Skolem. La crítica 
de Skolem se dirige principalmente contra esta cláusula. Según él, no está 
claro el significado de la expresión *F(f) que allí figura. Designa, al pa- 
recer, una función de funciones proposicionales; pero Zermelo no explica 
como debe entenderse este concepto. Skolem reclama una mayor precisión 
sobre esto. En efecto, según él, si el concepto de función proposicional se 
piensa con tal amplitud que abarque el concepto de función de funciones 
proposicionales, puede generarse la paradoja de Russell. Por otra parte, si 
sólo se admiten funciones de funciones proposicionales construidas a partir 
de éstas mediante las cinco operaciones lógicas arriba mencionadas, los 


a Para los lectores que no estén familiarizados con la lógica moderna, doy una versión 
de cálculo predicativo de primer orden en el Apéndice IX. 

1 Nótese que esta definición concuerda con la de Weyl (1910), que Skolem no mencio- 
na. 
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axiomas de Zermelo (1908a) combinados con la definición de “definit* de 
Zermelo (1929) no autorizan la formación de ningún conjunto que no sea 
posible ya en virtud de esos mismos axiomas combinados con la definición 
más simple de *definit” de Skolem (1922).!* 


1.8.3 El Axioma de Reemplazo 


El sistema de axiomas para la teoría de conjuntos conocido por la sigla ZF 
—con Z de Zermelo y F de Fraenkel— se distingue del sistema original de 
Zermelo (1908a) en cuanto excluye el Axioma de Selección (cuya inclusión 
genera el sistema llamado ZFC, con C de choice) y contiene un axioma 
nuevo, el Axioma de Reemplazo, propuesto —independientemente— por 
Fraenkel y por Skolem en 1922." 

Fraenkel (1922) justifica la necesidad del Axioma de Reemplazo así: Si Z, 
es el conjunto infinito cuya existencia postula el Axioma VII y (para cada n 
> 0) designamos con Z, al conjunto potencia WZ,, , cuya existencia resulta 
de la aplicación reiterada del Axioma IV a Z,, es fácil ver que los axiomas 
de Zermelo no garantizan la existencia del conjunto infinito (Zp, Zi»... y. 


16 Skolem, SWL, pp. 276-77. Skolem 1930 concluye con “una observación de orden 
general” que anticipa aspectos esenciales de la famosa argumentación de Gódel 1931. 
“Si para caracterizar las funciones proposicionales se establecen axiomas que expresen 
ciertos requisitos de reproducción como las cláusulas [1-4] de Zermelo, tales axiomas 
se dejan concebir [...] como “aseveraciones aritméticas”” (Skolem, SWL, p. 278). 
Sea O el más pequeño modelo concebible del dominio de funciones proposicionales 
caracterizado por tales axiomas. En virtud del teorema de Lówenheim-Skolem (vide 
infra, p. 98), lOl = X,. Supongamos que la teoría axiomática de conjuntos de Zermelo 
(mejorada con su definición de “definit”) tiene un modelo B. Entonces, B contiene un 
conjunto infinito numerable Z, y existe una biyección de Z, en O. Sea S, la función 
proposicional de una variable que dicha biyección asigna a n e Z,. Sea X(x) la función 
proposicional de una variable que es verdadera para x =n € Z, si y sólo si S,(n) es 
falsa. X(x) obviamente difiere de S,(x) para cada n e Z, y por lo tanto no pertenece al 
modelo O. Por otra parte, 2(x) es una función proposicional bien definida conforme a 
la exigencia que Zermelo (1929, p. 341) impone a este concepto. “En otras palabras, 
parece imposible caracterizar mediante una dada axiomática finita un concepto de 
“definit” que concuerde con [dicha exigencia]” (Skolem, SWL, p. 279). 

e Mirimanoff (1917, p. 49) postuló que si un conjunto A es equinumeroso con una co- 
lección de conjuntos B, entonces B también es un conjunto; este postulado equivale al 
Axioma de Reemplazo. Pero la obra interesantísima de Mirimanoff no fue reconocida 
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Por lo tanto, si el cardinal del continuo es menor que Y,, no es posible es- 
tablecer en el sistema de Zermelo que hay conjuntos cuyo cardinal sea igual 
o mayor que X,,'' El Axioma VII, claro está, se puede reformular de modo 
que asegure la existencia del conjunto (Z,, Z;,..- ), pero el procedimiento 
utilizado para definirlo podría entonces aplicársele a él mismo, caracterizando 
así nuevos conjuntos cuya existencia, aunque manifiestamente plausible, no 
estaría garantizada por el sistema. Fraenkel propone, en cambio, una solución 
general de la dificultad que consiste en adoptar el axioma siguiente: 


AXIOMA DE REEMPLAZO. Si M es un conjunto y cada elemento de M se re- 
emplaza con [lo que Zermelo llama] una cosa del dominio VB, M 
se convierte en otro conjunto. 


Este enunciado que habla de reemplazos y conversiones tiene más de receta 
que de axioma, pero poco más tarde Fraenkel (1925, p. 254) ofrecerá una 
formulación más rigurosa: Si q es una función —en el sentido de Fraenkel 
(1922a) explicado en la Sección 1.8.2— y M es un conjunto, entonces también 
es un conjunto la imagen de M por €, esto es, (p(x): x e M). Ocurre, empero, 
que —como demostrará von Neumann (1928a, p. 377)— esta aseveración se 
deduce de los axiomas I-V de Zermelo (1908a) y por lo tanto no basta para 
establecer que existe un conjunto cuyo cardinal es igual o mayor que N,,. 
Pero esta debilidad se remedia recurriendo a un concepto de función menos 
estrecho. Una función q en el sentido de Fraenkel tiene que estar definida 
en cierto conjunto M. En cambio, según von Neumann (1928a, p. 376), la 
función (q mencionada en el Axioma de Reemplazo debe estar libre de esta 
restricción y admitir como argumento cualquier objeto susceptible de serlo 
que pertenezca al dominio de la teoría. 

Así fortalecido, el Axioma de Reemplazo concuerda precisamente con el 
propuesto por Skolem al Congreso de Matemáticos Escandinavos de 1922, 
en la misma ponencia en que introdujo la definición de definit que cité en 
la Sección 1.8.2 (Skolem 1922): 


por los estudiosos de la teoría de conjuntos antes de 1925, cuando fue citada por von 
Neumann (vide infra, nota 20). 

18 Fraenkel hizo esta objeción a Zermelo en una carta fechada el 6 de mayo de 1921 
(citada en Moore 1982, p. 263 n. 10). 
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Sea U una aseveración bien definida (definite) que vale para ciertos pa- 
res ordenados (a,b) de objetos pertenecientes al dominio *Y de modo que 
para cada a hay a lo sumo un b tal que U es verdad. Según a recorre 
los elementos de un conjunto M,, b recorre todos los elementos de un 
conjunto M,. 

(Skolem, SWL, pp. 143s.) 


Skolem exhibe la insuficiencia del sistema original de Zermelo mediante el 
mismo ejemplo aducido por Fraenkel, a saber, el conjunto (Z,, Z,, . .. ) arriba 
descrito; pero Skolem da una demostración rigurosa de la insuficiencia de ese 
sistema para garantizar la existencia de dicho conjunto. Para ello introduce el 
importante concepto de rango (Stufe) de un conjunto, que caracteriza como 
sigue. Sean P"M y U"M los conjuntos formados reiterando n veces la ope- 
ración de formar, respectivamente, el conjunto potencia y el conjunto unión 
de un conjunto dado M (Axiomas IV y V de Zermelo). Sea P%M = UM = 
M. Diremos que el conjunto M es de primer rango si hay un entero n 2 0 
tal que U"M = Y. (Recordando que Z, = (9,40), ((0$),.... ), advertimos 
que U”Z, = Z, para todo n > 0; por lo tanto, Z, no es un conjunto de primer 
rango). Para cada entero k > 1, diremos que el conjunto M es de k-ésimo 
rango si M no es de (k-1)-ésimo rango pero hay un entero n > O tal que 
todos los elementos de U"M son conjuntos de (k-1)-ésimo rango. (Nótese 
que, conforme a esta estipulación, Z, es un conjunto de segundo rango). Sea 
B un dominio en que satisface los siete axiomas de Zermelo. En virtud del 
Axioma VII, B contiene un conjunto infinito que llamaremos, como siempre, 
Z,. Supongamos que B contiene además el conjunto (Z,, Z,,... ). Sea B' el 
subdominio formado por todos los conjuntos de primer o segundo rango que 
hay en B. Se puede verificar fácilmente que B” también satisface los axiomas 
de Zermelo. Obviamente, Z, pertenece a B”, puesto que es un conjunto de 
segundo rango, pero (Z,, Z;, -.. ) es un conjunto de tercer rango y por lo 
tanto no puede pertenecer a B”. Como los axiomas de Zermelo se cumplen 
en B”, es claro que no bastan para garantizar la existencia del conjunto (Z,, 
Zi, .- ). En una nota, Skolem esboza una prueba de que el Axioma de Re- 
emplazo basta para remover la deficiencia (Skolem, SWL, p. 146n.). 
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John von Neumann fue uno de los matemáticos más versátiles y fecundos 
del siglo XX. Su teoría matemática de los juegos y sus ideas sobre el diseño 
de computadoras han revolucionado el mundo de los negocios. Su aporte a 
la sistematización matemática y la clarificación conceptual de la mecánica 
cuántica, aunque muy discutida, también ha tenido una influencia enorme.” 
Contribuyó decisivamente a la teoría de conjuntos con una serie de trabajos 
publicados cuando tenía entre 20 y 25 años. En esta sección presentaré su 
innovadora concepción de los ordinales (1922/23) y las ideas centrales de 
su sistema axiomático (1925, 1928), aunque sin dar una presentación com- 
pleta del mismo. En el Apéndice VIII explico cómo empleó su teoría de los 
ordinales para justificar la definición por inducción transfinita. 

Como sabemos, Cantor llegó a definir los ordinales como “tipos de orden”. 
Dos conjuntos ordenados tienen el mismo “tipo de orden” si son “similares”, 
esto es, si hay entre ellos un isomorfismo de órdenes. Un ordinal es el tipo 
de orden de un conjunto bien ordenado. Von Neumann considera que este 
procedimiento es “algo vago” y propone reemplazarlo por otro, “basado en 
Operaciones unívocas con conjuntos”. La definición de Cantor se deja traducir, 
por cierto, a términos estrictamente conjuntistas: “El ordinal de un conjunto 
bien ordenado es la clase de todos los conjuntos similares a él”. Pero si esto 
es un ordinal, no hay ninguna garantía de que existan conjuntos de ordinales 
y el intento de formarlos puede generar paradojas. 


za Sobre la teoría de los juegos, véase von Neumann 1928b, von Neumann y Morgenstern 
1944. Sobre la mecánica cuántica, véase en particular von Neumann 1927a, 1932; 
Birkhoff y von Neumann 1936. La principal contribución de von Neumann al diseño 
de la computadora moderna consistió nada menos que en la idea misma de software, 
esto es, la idea de que las instrucciones para resolver un problema deben registrarse 
temporalmente en la memoria electrónica del aparato —al igual que los datos del 
problema, aunque premunidas de un codificación que diferencie estas dos clases de 
input— en vez de incorporarlas en la configuración fija de sus circuitos eléctricos. La 
idea es simple, pero genial, y aparentemente no se le había ocurrido a ninguno de los 
matemáticos e ingenieros que trabajaron en el diseño de computadoras electrónicas antes 
de que von Neumann entrase en este campo en 1944. En las primeras computadoras, 
construidas para las fuerzas armadas de Gran Bretaña y los Estados Unidos durante la 
Segunda Guerra Mundial, había que reconfigurar los circuitos cada vez que se quería 
abordar otro tipo de problemas. Cf. Pollack 1982, p. 19. 
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La definición de ordinal de von Neumann es una aplicación brillante del 
Axioma de Reemplazo que Fraenkel acababa de publicar (von Neumann lo 
cita). Sea (M,<) un conjunto ordenado. Si x e M, el conjunto [ye M: y < 
x) —abreviado A(x,M)— es el segmento de x en (M,<). Supongamos que 
(M,<) es un conjunto bien ordenado. Una enumeración (Ziihlung) de M es 
una aplicación f que asigna a cada x e M el conjunto f(x) = (fGy): y € 
A(x,M)). En otras palabras, el valor de f para cada x e M es el conjunto de 
todos los valores de f correspondientes a los elementos que preceden a x en 
(M,<). Obsérvese que f(x) es un conjunto en virtud del Axioma de Reempla- 
zO, puesto que A(x,M) lo es en virtud del Axioma de Separación. También 
Lf00: x e M) es un conjunto (por el Axioma de Reemplazo), que llamaré 
provisionalmente “el ordinal de (M,<) determinado por la enumeración f”. 

Cualquiera que sea el conjunto bien ordenado (M,<), si x, es su primer 
elemento, f(x,) = 49. Por lo tanto, si x,, x, y x, son respectivamente, el se- 
gundo, tercer y cuarto elemento de (M,<), tenemos que 


fx) => (9) 
f) = (010 
ff) = 10100053. 


Visiblemente, el conjunto bien ordenado (M,<), admite una y sólo una 
enumeración f, la cual determina un ordinal único, que llamaremos en 
adelante el ordinal de (M,<). Si (M,<) es un conjunto bien ordenado y f es 
su enumeración, entonces f(x) £ f(x) para todo x e M. Six, ye My x 
< y, entonces f(x) < f(y). Von Neumann (1922/23) ofrece demostraciones 
detalladas de estas proposiciones y luego establece la siguiente importante 
caracterización de los ordinales: 


P es un ordinal si y sólo si (1) P es un conjunto de conjuntos, 
ordenable por inclusión; (11) su orden por inclusión es un buen or- 
den; (iii) si € € P, € = A(E, P) (cada elemento de P es su propio 
segmento en (P,C)). 


2 Este ejemplo lo daba ya Mirimanoff (1917, p. 46), quien descubrió antes que von 


Neumann esta forma de construir los ordinales. Von Neumann conocía la obra del 
matemático ruso y la menciona expresamente (1925, p. 230n.). 
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Usando esta caracterización von Neumann prueba que si P es un ordinal, P 
es el conjunto de todos los ordinales diferentes de P e incluidos en P; que, 
si P y O son dos ordinales diferentes uno de los dos está incluido en el otro, 
y que si U es un conjunto cualquiera de ordinales, la relación de inclusión 
C determina un buen orden en U. Una segunda caracterización, derivable de 
la anterior, es ésta: P es un ordinal si y sólo si todo elemento de P es un 
ordinal incluido en P. Con estos recursos, von Neumann puede demostrar 
fácilmente que los ordinales definidos a su manera satisfacen estos teoremas 
clásicos de la teoría cantoriana del buen orden: Dos conjuntos bien ordenados 
son similares si y sólo si sus ordinales respectivos son idénticos; un conjunto 
bien ordenado es similar a un segmento de otro conjunto bien ordenado si 
y sólo si el ordinal del primero está incluido en el ordinal del segundo; si 
(M,<) es un conjunto bien ordenado hay un y sólo un ordinal que, ordenado 
por inclusión, es similar a (M,<), a saber, el ordinal de (M,<). 

Gracias a que concibe los ordinales como conjuntos de cierta índole von 
Neumann puede identificar los cardinales infinitos con ordinales, como se 
hace con los finitos. Digamos que el ordinal dí es un cardinal si todo otro 
ordinal equinumeroso con Q. es mayor que Q: (von Neumann 1928, p. 731). 
En otras palabras, un ordinal es un cardinal si es el primer ordinal de su 
numerosidad. Como cada ordinal finito es más numeroso que su predecesor, 
todos son cardinales. En cambio, entre los ordinales infinitos sólo es un 
cardinal el primero de cada clase cantoriana. Los cardinales infinitos como 
los define von Neumann corresponden, pues, precisamente a los alephs de 
Cantor. Ahora bien, si un conjunto M admite un buen orden <, M es equinu- 
meroso con el ordinal de (M,<); por lo tanto, bajo el Axioma de Selección 
cada numerosidad está representada por un aleph, o sea, un cardinal en el 
sentido de von Neumann. Pero si no se acepta este axioma, será conveniente 
disponer de una segunda definición de “cardinal” restringida a los conjuntos 
que no pueden ser bien ordenados (cf. Levy 1979, p. 83). 

“La construcción axiomática de la teoría general de los conjuntos” es el 
tema de la tesis doctoral sometida por von Neumann en 1925 a la Universidad 
de Budapest (en húngaro). Sabemos que en agosto de 1923 había enviado 
una versión alemana a Zermelo.” Fraenkel recordará treinta años después 


21 Véase la carta de von Neumann a Zermelo del 15 de agosto de 1923 en Meschkowski 
1967, pp. 27173. 
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que “alrededor de 1922-23” la redacción de Mathematische Zeitschrift 
lo consultó sobre “un largo manuscrito de un autor para él desconocido, 
Johann von Neumann, titulado “Die Axiomatisierung der Mengenlehre”, el 
cual era su futura disertación doctoral, que la revista publicaría recién en 
1928.” Fraenkel dice que, aun sin entenderlo del todo, pudo reconocer ex 
ungue leonem y dio una opinión favorable. A la vez, invitó a von Neumann 
a una entrevista en la cual le aconsejó que “preparara el terreno para la 
comprensión de un ensayo tan técnico con otro más informal que destacase 
el nuevo enfoque del problema y sus principales consecuencias.” Siguiendo 
este consejo, von Neumann redactó “Eine Axiomatisierung der Mengenlehre” 
(1925). Este artículo, que he tomado de base para la exposición siguiente, 
no deriva teoremas, pero en cambio explica la motivación de los axiomas 
y contiene importantes consideraciones de interés filosófico que faltan en la 
presentación formal (1928). 

Von Neumann empieza describiendo dos modos de reaccionar ante las 
paradojas de la teoría de conjuntos. El primero, representado por Russell, 
Brouwer, Weyl y el húngaro Kónig, “se propone la meta de establecer la 
ciencia exacta entera sobre una nueva base evidente para todos, desde la 
cual pueda nuevamente alcanzarse lo “correcto” en matemáticas y teoría 
de conjuntos, pero excluyendo de antemano lo contradictorio gracias a la 
fundamentación intuitiva inmediata” (1925, p. 220). La impresión que de- 
jan estos autores es “aniquiladora”: mientras Russell hace descansar toda la 
matemática en el cuestionable “Axioma de Reducibilidad”, Weyl y Brouwer 
rechazan consecuentemente la mayor parte de ella como carente de sentido 
y critican a fondo los métodos elementales de inferencia empleados normal- 
mente en sus demostraciones. La segunda reacción, iniciada por Zermelo, 
retiene los métodos lógicos tradicionales pero descarta el concepto ingenuo 
de conjunto. Para reemplazarlo, se postulan axiomas en que figura la palabra 
“conjunto” pero sin atribuirle un significado: “Por “conjunto” se entiende aquí 
[ ... ] sólo una cosa de la que no se sabe ni se quiere saber más que lo 
que al respecto se sigue de los postulados. Éstos tienen que formularse de 


2 Las dos citas de Fraenkel están tomadas de una carta suya a Ulam, transcrita en parte 


en Moore 1982, p. 264. 
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tal modo que de ellos se sigan todos los teoremas deseados de la teoría de 
conjuntos cantoriana, pero no las antinomias” (p. 220). 

Von Neumann dice que su escrito pertenece a la segunda corriente. Con 
todo, el término matemático tradicional que caracteriza mediante axiomas 
no es “conjunto”, sino “función”, utilizado luego para definir “conjunto”. 
Obviamente cualquier conjunto M (en el sentido intuitivo del término) puede 
representarse de un modo inequívoco mediante su función característica, que 
asigna un valor fijo (por ejemplo, 1) a todos los objetos que pertenecen a 
M y otro valor fijo (por ejemplo, 0) a todos los objetos que no pertenecen a 
M. El sistema de von Neumann se apoya en esta observación. Sus axiomas 
se refieren a dos clases de objetos, llamados informalmente “funciones” y 
“argumentos” (el título formal es *cosas-I” y *cosas-II” —1. Dinge y HH. Din- 
ge— pero lo evitaré en mis explicaciones). Hay dos argumentos distinguidos, 
A y B (que hacen el papel de O y 1 en el ejemplo anterior). Si a y b son 
argumentos, (a,b) es un argumento, el par ordenado cuyo primer elemento es 
a y cuyo segundo elemento es b. (Repitiendo la operación de formar pares, 
se obtiene el n-tuplo (a,,...,a,) =((a,,...,4,_;),4,)). Si f es una función y 
a es un argumento, [f,a] es un argumento, el valor de f en a. Puede haber 
argumentos que a la vez son funciones —los llamaré “funciones-argumentos” 
(el título formal es 1.11. Dinge)— y es esencial que haya funciones que no 
pueden ser argumentos, esto es, objetos cuyo nombre sólo puede ocupar el 
primer lugar —nunca el segundo— en una expresión de la forma [f,a]. 

Un dominio (Bereich) es una función f tal que, para todo argumento x, O 
bien [f,x] = A, o bien [f,x] = B. Si el dominio f es una función-argumen- 
to, von Neumann dice que f es un conjunto. Introduce la abreviatura a € 
f para decir que f es una función y a es un argumento tal que [f,a] + A. 
Obsérvese que para usar esta abreviatura no se requiere que [f,a] = B; en 
otras palabras, es lícito escribir a € f aunque f no sea un dominio. Por otra 
parte, si £ y g son funciones, la expresión *f e g” tiene sentido si y sólo si 
f es una función-argumento. Evidentemente, si f es un dominio pero no es 
un conjunto —esto es, si f no es una función-argumento—, no puede existir 
un dominio g tal que f e g. En tal caso, diré que f es un dominio propio.” 


2 Entiéndase “propio” como lo contrario de “impropio”. Más castizo sería decir “dominio 


propiamente tal” pero la expresión es incómodamente larga. En la terminología de 
Gódel (1940), comúnmente aceptada en la literatura matemática actual, un objeto k es 
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Intuitivamente, un dominio propio f se puede ver como una colección de 
elementos —los argumentos x tales que [f,x] = B— que no es a su vez 
elemento de ninguna colección. Gracias a que admite dominios que no son 
conjuntos von Neumann elude las paradojas clásicas sin coartar la libertad del 
matemático para concebir objetos y darles nombre. Como veremos, el sistema 
contiene un criterio preciso para determinar qué dominios no son conjuntos. 
Intuitivamente se lo puede expresar así: el dominio f es un dominio propio 
si y sólo si la totalidad de los argumentos x tales que x e f no es menos 
numerosa que la totalidad absoluta de los argumentos. 

Los axiomas de von Neumann forman cinco grupos. El grupo I de “axio- 
mas introductorios” postula la existencia de los argumentos A y B, fija la 
sintaxis de las expresiones [x,y] y (x,y), y estipula que las funciones f y g 
son idénticas si [f,x] = [g,x] para todo argumento x. Los grupos II y III 
—“axiomas de construcción aritmética y lógica”— sirven principalmente 
para asegurar que las todas las expresiones debidamente formadas con desig- 
nadores (constantes o variables) de argumentos y funciones y los símbolos 
L, (, ], )», =, V, puedan reducirse a ciertas formas normales (como explicaré 
en las dos próximas notas). 

El grupo ll postula que existen (1) la función identidad, esto es, una fun- 
ción ¡ tal que, para todo argumento x, [i,x] = x; (2) una función constante 
para cada argumento u, esto es, una función c, tal que para cada argumento 
x, [c,,x] = u; (3 y 4) las proyecciones sobre el primer y sobre el segundo 
elemento de cada par ordenado, esto es, funciones p, y p, tales que, para 
todo par (x,y), [p,Xx,y),] = x y [p,<x,y)] = y; (5) una función h tal que, para 
cada par ordenado (f,x) cuyo primer elemento es una función-argumento, 
[nXf,x)] = [f,x]. Postula además que, para cualesquiera funciones dadas f 
y g, existen (6) la función producto fx g tal que, para todo argumento x, 
[fx gx] = ([f.x1.[g,x1), y (7) la función compuesta f o g tal que, para todo 
argumento x, [f o g,x] = (Lf.Lg,x1).4 


una clase (class) si es el conjunto vacío, k = Lx: x + x), o cumple la condición x(x 
€ k). Si Vx(k £ x), decimos que la clase k es una clase propia (proper class). 


di Gracias a los axiomas del grupo Il von Neumann (1928, pp. 670ss.) puede demostrar el 


siguiente Teorema de Reducibilidad: Sea T una expresión formada según las reglas del 
grupo 1 con nombres de argumentos y funciones, los símbolos [, ], (, ), y n variables 
En ++. E, Sea t(Aa,, ... ,a,) la expresión que se obtiene al reemplazar consistentemente 
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El grupo HI postula (1) que hay una función f tal que, para todo par orde- 
nado (x,y), (xy) e f si y sólo si x = y; (2) que, si f es una función, hay 
una función h tal que para todo argumento x, x e h si y sólo si para todo 
argumento y, (x,y) £ f; y (3) que, si f es una función, hay una función h 
tal que para todo argumento x, [A,x] = y cuando quiera que y es el único 
argumento tal que (x,y) e f.2 

El grupo IV demanda más atención. Los dos axiomas de que consta 
sirven, respectivamente, para distinguir a las funciones-argumentos de los 
argumentos que no son funciones y de las funciones que no son argumentos. 
No obstante la simetría de sus propósitos, su alcance es muy diferente. El 
Axioma IV.1 es prescindible, pues no habría ningún inconveniente formal 
en suponer que todos los argumentos son a la vez funciones, esto es, que 
cualquier objeto de la teoría puede nombrarse en primer lugar en una expre- 
sión encerrada por corchetes (aunque esta suposición contraría evidentemente 
nuestras ideas intuitivas de argumento y función). En cambio, el Axioma 
IV.2 es la pieza central del sistema de von Neumann y de él se deducen el 
Axioma de Separación, el Axioma de Reemplazo y el Axioma de Selección. 
He aquí una traducción literal de estos axiomas (seguida de una paráfrasis 
entre paréntesis): 


1v.1 Hay una cosa-Il a tal que una cosa-1 x es una cosa-I/Il si y sólo 
si [a,x] + A. 
(Hay una función a tal que un argumento x es una función-argu- 
mento si y sólo si x e a.) 


en T la variable €, por un nombre del argumento a, (1 < k < m). Entonces existe una 

función f tal que, para todo n-tuplo de argumentos X = (X,,... ,x,), si T(X) designa un 

argumento, [f.x] = 1(x). 
25 El grupo III garantiza que, si P(a) expresa una condición impuesta a un n-tuplo de 
argumentos a = (a,,....,a,), habrá siempre una función f tal que D(a) si y sólo si 
[f,a] + A (esto es, si y sólo si a e f). El Axioma IIL.1 lo asegura si P(a) envuelve 
identidades y IIL.2 si envuelve cuantificación universal o existencial, mientras que 111.3 
implica que cualquier objeto y determinado implícitamente por una condición [f.(x, y)] 
+ A tiene también una representación explícita y = [h,x]. 
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1v.2 Una cosa-II a no es una cosa-1/Il si y sólo si hay una cosa-II b 
tal que para cada cosa-I x existe un y que cumple las condiciones 
[a,y] %A y [b,y] = x. 
(Una función a no es una función-argumento si y sólo si hay una 
función b tal que para todo argumento x, [b,y] = x para algún y e 
a.) 


Como se puede ver, el Axioma IV.2, con toda su tremenda fuerza, es suma- 
mente simple. Restringido a cosas-II (funciones) que sean dominios lo que 
dice es esto: Un dominio a es un dominio propio— y no un mero conjun- 
to— si y sólo si hay una función b que lo aplica sobre el universo de todos 
los argumentos. Recordando el distingo tardío de Cantor entre pluralidades 
inconsistentes y consistentes (Capítulo 1.6), podemos decir que en el sistema 
de von Neumann una pluralidad es “demasiado grande” para ser recogida 
como elemento en otra pluralidad si, pero solamente si es “tan grande” 
como la pluralidad de todos los objetos ordinarios (conjuntos y elementos 
de conjuntos). Pero en este sistema un objeto así “tan grande” admite una 
interpretación natural como función que no es a su vez argumento de otra, 
y no hace falta entender que los objetos que esa función admite como 
argumentos no pueden “existir todos conjuntamente” (Cantor, GA, p. 443; 
citado en el Capitulo 1.6). 

Los tres axiomas del grupo V —”axiomas del infinito”— equivalen precisa- 
mente al Axioma del Infinito, el Axioma de Unión y el Axioma del Conjunto 
Potencia. Sólo el primero difiere significativamente en su formulación del 
respectivo axioma de Zermelo, pues, aunque postula como éste la existencia 
de un conjunto enumerablemente infinito, lo construye de otro modo. Doy 
una paráfrasis de este axioma: 


v.1 Existe una función-argumento a con las siguientes propiedades: 
Hay una función-argumento x tal que x e a. Si y es una función- 
argumento tal que y e a, hay una función-argumento z + y tal que 
zZ€ a y para todo x, x e y implica x e z. 


Las funciones-argumentos de que aquí se habla no tienen que ser conjuntos, 
pero si todas lo fuesen el conjunto a cuya existencia se postula admitiría la 
caracterización siguiente: (1) a es un conjunto no vacío; (11) algunos elementos 
de a son conjuntos; (111) todo conjunto que es un elemento de a es parte de 
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otro conjunto diferente que también es un elemento de a. 

Von Neumann hace hincapié en que el grupo V sólo es indispensable para 
la teoría de los cardinales infinitos, pero que los primeros cuatro grupos de 
axiomas bastan para fundar la teoría de los conjuntos finitos y los números 
naturales (enteros no negativos), así como una parte significativa de la teoría 
del continuo, inclusive la definición de los números reales como secuencias 
de Cauchy de racionales, los teoremas de convergencia de secuencias y series, 
la teoría de las funciones continuas, el álgebra, el análisis y la integral de 
Riemann. Pero sin el grupo V “carecen de sentido el Teorema de Weierstraf 
sobre el supremo (de conjuntos numéricos, no secuencias), puesto que no 
puede haber conjuntos de cosas-Il; asimismo el concepto general de función, 
el buen orden del continuo, la integral de Lebesgue” (von Neumann 1925, 
p. 237). 

Después de presentar los axiomas y bosquejar rápidamente el orden en 
que la teoría de conjuntos se deduce de ellos (en su 1928), von Neumann 
desarrolla algunas consideraciones escépticas sobre su significado y utilidad 
(1925, pp. 22940). Ellas giran esencialmente en torno al hecho de que la 
teoría ofrecida no es categórica. En la Sección 1.8.1 indiqué que una teoría 
axlomática se dice categórica si todos sus modelos son isomórficos. Como 
un axioma nada dice sobre la naturaleza individual de los objetos a que se 
refiere y sólo puede especificar la estructura resultante de sus relaciones 
mutuas, una teoría categórica caracteriza su tema con la máxima precisión 
alcanzable por un sistema axiomático. Von Neumann muestra que la teoría 
determinada por sus axiomas no es categórica y sostiene que ninguna teoría 
axlomática de conjuntos puede serlo. Según él, esto resulta de un teorema 
demostrado por Lówenheim (1915) y generalizado por Skolem (1920, 1922). 
Conforme a ese teorema, si una teoría T' formulable en un cálculo predica- 
tivo de primer orden tiene un modelo infinito, T' tiene un modelo M, con 
cardinal k para cada k > N,. Obviamente, M, no puede ser isomórfico a 
M, si k + A. El Teorema de Lówenheim-Skolem se aprecia mejor a la luz 
de la semántica de Tarski y me referiré a él en el Capitulo 3.2. Por eso, 
de las ideas presentadas por von Neumann en la última parte de su artículo 
de 1925 mencionaré aquí una sola, que no envuelve dicho teorema y que 
nos ayudará a entender el trabajo de Zermelo (1931) que estudiaremos en 
la Sección 1.8.5. 
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Los Fundamentos de la geometría de Hilbert incluyen desde la segunda 
edición un “axioma de completud”,? destinado a asegurar la categoricidad 
de la teoría. En virtud del mismo, un modelo de la teoría no puede estar 
incluido como parte propia en otro modelo que preserve las relaciones 
geométricas entre los elementos del primero.” Inspirándose en el ejemplo de 
Hilbert, Fraenkel propuso completar la teoría axiomática de conjuntos con 
el siguiente Axioma de Limitación: 


AL Aparte de los conjuntos que forzosamente tienen que existir en 
virtud de los axiomas, no existen otros conjuntos. 


Von Neumann (1923, p. 230) observa que esta formulación es vaga y la 
reemplaza por otra más precisa (ajustada, además, a su terminología). Sea 
* un modelo de la teoría de von Neumann, esto es, un sistema de cosas-I 
y cosas-Il (“argumentos” y “funciones”), en el cual se distinguen dos co- 
sas-L, A y B, y las operaciones ( , ) y [ , ] están definidas de manera que 
se cumplan todos los axiomas de los grupos -V. *” es un subsistema de Y 


26 Pido excusas por este neologismo feísimo, pero firmemente arraigado entre los especia- 


listas de habla castellana (algunos prefieren decir “completitud”, que no suena mejor). 
Corresponde al sustantivo alemán *Vollstándigkeit” y al inglés *“completeness”, que 
designan justamente la calidad de lo es o está completo (vollstindig, complete). Más 
eufónico hubiera sido quizás “complenitud”, ligado al verbo latino compleo (de donde 
completus, *completo”) del mismo modo que “plenitud” está ligado con el verbo pleo 
(Henar”). Pero los profesores de lógica ya no estudian lenguas clásicas. 


de “V.2 (Axioma de completud lineal). El sistema de los puntos de una recta con sus re- 


laciones de orden y congruencia no admite una ampliación que preserve las relaciones 
entre los elementos anteriores así como las propiedades fundamentales que se derivan 
de los Axiomas I-II de orden lineal y de congruencia y V.1” (Hilbert, GG, p. 30; el 
Axioma V.1 es el Postulado de Arquímedes). Sin este axioma la teoría de Hilbert no 
es categórica, pues el modelo numérico mencionado en la Sección 1.8.1 incluye una 
parte propia que satisface los axiomas restantes si se mantiene la interpretación de 
los primitivos y la definición pitagórica de distancia, a saber, el conjunto de los tríos 
ordenados de números algebraicos. Esta estructura no es isomórfica a la primera, pues 
el conjunto de los números algebraicos es numerable, mientras que R no es numerable. 
Obsérvese que en virtud del Axioma V.2, el sistema de los puntos construibles con 
regla y compás, estudiado por Euclides, no es un modelo de la teoría de Hilbert, 2* 
edición, a pesar de que satisface los Axiomas LIV y V.1; porque dicho sistema es una 
parte propia del espacio homeomorfo a [R* estudiado por Descartes y los geómetras 
modernos, que es un modelo de esta teoría. 
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si E consta de un sistema I' de cosas-I y un sistema II” de cosas-IT, todas 
las cuales pertenecen también a X, y A” y B' son cosas distinguidas de I' 
(posiblemente diversas de A y B), y las operaciones ( , Y y [ , J' definidas 
en Y son las restricciones de ( ,) y [,] a Y y IÍ (es decir, (f,xY = (f,x) 
y [x, yl! = [x,y] si f pertenece a I' y x e y pertenecen a I'). Diré que el 
subsistema *” es un submodelo si los axiomas de los grupos I-V también 
se cumplen si se entiende que se refieren a las cosas-I de Y”, las cosas-II de 
IT”, las operaciones ( , Y y [ , l' y los objetos distinguidos A” y B”.4 Usando 
este vocabulario el Axioma de Limitación puede reformularse así: 

AL, Si 2 es un modelo de los axiomas de los grupos I-V y Y % 2 es 

un subsistema de *, *' no es un submodelo. 


Von Neumann señala que la relación “ser un subsistema de” que aquí figura 
no puede asimilarse a la relación *C” definible en su teoría (u C v si y sólo 
si u y v son funciones y para todo argumento x, x e u implica que x e v), 
por cuanto el modelo 2 de que se habla necesariamente contiene funciones 
(cosas-II) que no son argumentos (cosas-I), y por lo tanto no puede ser él 
mismo una función con la que otra función tenga la relación *C”. Parecería 
pues que hay que entender la relación “ser un subsistema de” en su acep- 
ción conjuntista ingenua, que tendríamos que dar por supuesta. El intento 
de rescatar la teoría de Cantor mediante la caracterización axiomática de 
sus conceptos fundamentales se vería entonces abocado al fracaso. Como 
solución de esta dificultad, von Neumann adelanta la idea que me interesa 
presentar. Consideremos un modelo P de la teoría de von Neumann que 
comprende un sistema 1, de argumentos y un sistema II, de funciones, con 
operaciones ( , )» y [ , ], y argumentos distinguidos A, y B,. Supongamos 
que todas las cosas-I y las cosas-II del anterior modelo 2 están contenidas 
en 1, y que para toda cosa-I! f de 2 hay una función ( en II, tal que, para 
toda cosa-I x de *, [6Xf,x)p], es idéntico al valor [f,x] determinado por la 


as Menciono dos objetos distinguidos A” y B” (o, respectivamente, A y B) por seguir a 


von Neumann, pero en rigor para obtener un modelo de sus axiomas basta distinguir 
una sola cosa del tipo 1. En efecto, los axiomas de von Neumann mencionan un solo 
argumento distinguido (A); el segundo (B) aparece en las definiciones de “dominio” y 
“conjunto”, términos que no se utilizan en los axiomas. 
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operación [ , ] en 2. Entonces X es un dominio en P y los subsistemas de 
Y tienen con 2 la relación “C” (en P). 


Así habríamos sobreimpuesto a 2 una “teoría de conjuntos superior” P, en 
la que también son argumentos cosas que en 2 no pueden serlo. Esto no 
es absurdo de suyo. Si aceptamos como argumentos en un sistema nuevo 
P a los conjuntos que eran “demasiado grandes” para ser argumentos [en 
2], podemos siempre esquivar las antinomias si admitimos a su vez los 
conjuntos “aún más grandes” (esto es, demasiado grandes en P) constitui- 
dos por aquéllos, pero los declaramos inadmisibles como argumentos. 
(Von Neumann 1925, p. 231) 


Aunque la nueva idea enseguida se revela impotente para fundar una teoría 


categórica,” abre a la reflexión matemática perspectivas insondables. Vere- 
mos ahora cómo Zermelo las despliega —con decidido espíritu cantoriano 
(y leibniziano)— en la presentación de su segundo sistema de axiomas para 
la teoría de conjuntos. 


29 


Sea N la teoría determinada por los cinco grupos de axiomas de von Neumann y NL 
la determinada por N y el axioma AL,. NL es categórica por definición, pero habría 
que ver si es consistente (relativamente a N). Para ello hay que formular condiciones 
necesarias y suficientes para que un subsistema de un modelo de N sea un submodelo 
y hallar un modelo de N ninguno de cuyos subsistemas las satisfaga. Von Neumann 
considera imposible formular tales condiciones sin incurrir en un círculo vicioso. Por 
ejemplo, el Axioma II.1 es verdadero en un subsistema 2” de un modelo * de N si y 
sólo si hay en *' una función f tal que, para todo argumento x en Y”, [f,x] = x. Según 
von Neumann no es lícito cuantificar sobre los argumentos del subsistema *' en el 
enunciado de las condiciones que deben servir para caracterizarlo. Podemos, claro está, 
cuantificar sobre los argumentos (y funciones) de 2, pero entonces obtenemos condi- 
ciones suficientes, mas no necesarias para que un subsistema de 2 sea un submodelo. 
Von Neumann da una lista de estas condiciones y muestra que todo modelo 2 de N 
contiene un submodelo mínimo X,, que las cumple todas. Entonces ningún subsistema 
de *, cumple todas esas condiciones, pero cualquiera de ellos podría ser un submodelo 
aunque no las cumpla. 
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1.8.5 Zermelo (1930) 


En el artículo “Sobre números-límite y dominios de conjuntos” (1930), 
Zermelo presenta un nuevo modo de concebir el tema mismo de la teoría 
de conjuntos. Formula un sistema de axiomas que se inspira en el suyo de 
1908 aunque difiere de él significativamente. El sistema no es categórico y 
Zermelo, que ve en ello una virtud (véase la nota 6), procede a establecer 
verdades generales sobre sus posibles modelos. Cada modelo M está caracte- 
rizado por dos parámetros: el cardinal de su “base” de Urelemente (véase la 
nota 5) y lo que Zermelo llama su “característica”, esto es, el primer ordinal 
mayor que todos los ordinales realizados en M. Zermelo demuestra que dos 
modelos M y M' son isomórficos si y sólo si tienen bases equinumerosas y 
la misma característica, y que si la característica de M es mayor que la de 
M', M contiene un submodelo isomórfico a M”. Las características inducen, 
pues, un buen orden entre las clases de equivalencia (por isomorfismo) de 
modelos con bases equinumerosas. Por otra parte, si dos modelos tienen la 
misma característica, uno de ellos será en todo caso isomórfico a una parte 
del otro, aunque sus bases no sean equinumerosas. La investigación “meta- 
teórica” de los modelos de la teoría axiomática se conduce en el estilo y con 
los conceptos del conjuntismo “ingenuo” de Cantor. Pero si existe un modelo 
M, con característica OL, la metateoría restringida a modelos de característica 
menor que Q: se deja establecer (en M,) como una consecuencia de la teoría 
axiomática. (Por otra parte, como el ordinal Q: no está realizado en M,, de 
todos modos hay que rebasar los recursos disponibles en este modelo para 
que dicha metateoría restringida pueda siquiera ser descrita como tal.) 

El sistema axiomático propuesto por Zermelo en 1930 reproduce sus 
axiomas de 1908 con dos notables excepciones: 1? Se excluye el Axioma 
de Selección (VID), porque “tiene otro carácter que los demás y no sirve para 


q Zermelo (1930) concibe los ordinales como tipos de orden, a la manera de Cantor. Así 


entendido, el ordinal QU: está realizado en el modelo M si existe en M un conjunto bien 
ordenado con tipo de orden 0. Pero si concebimos a los ordinales a la manera de von 
Neumann la expresión “a está realizado en M” puede entenderse en sentido literal: “el 
conjunto QL existe en M”. Evidentemente, si O está realizado en M en esta segunda 
acepción también lo está en la primera. Por otra parte, si hay en M un conjunto bien 
ordenado a con tipo de orden qt, los axiomas de Zermelo (1930) aseguran que el ordinal 
de von Neumann o. también existe en M (a es el alcance de la enumeración de a). 
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delimitar los dominios [de los modelos)” y Zermelo ahora lo considera como 
“un principio lógico universal presupuesto por toda nuestra investigación” 
(1930, p. 31). 2” Se excluyen los asertos existenciales absolutos, es decir, 
la postulación del conjunto vacío (2 (l, primera parte) y el Axioma del 
Infinito (VID.*! Se incluyen, pues, aseveraciones equivalentes a los Axio- 
mas de Determinación, Separación, Formación de Pares (I, última parte), 
Conjunto Potencia y Unión. Se incluye además el Axioma de Reemplazo y 
un nuevo “Axioma de Fundación” (mejor conocido en la literatura actual 
como “Axioma de Regularidad”), en virtud del cual no puede haber ninguna 
secuencia infinita a,, a,,... tal que a,,, e a, para todo n= 1 (por ende, no 
hay cadenas infinitas de la forma ...e a, e a,€ a,, ni ciclos de la forma 
ae be ... e a).” Zermelo designa cada uno de estos axiomas por letras 
que —con una excepción — corresponden a la inicial del respectivo nombre 
alemán. Llama ZF al sistema BAPUVE de los primeros seis, y ZF' al sistema 
completo BAPUVEF (F por Fundierung, “fundación”).* La presentación de 
los axiomas termina con esta importante observación metodológica: 


Llamamos “dominio normal” a un dominio de “conjuntos” y “elemen- 

tos primordiales” (“Urelemente”) que satisfaga nuestro sistema ZF” con 

respecto a la “relación fundamental” a e b. A los “dominios” de este 
” 113 ” 9 


género, sus “elementos”, “subdominios”, “uniones” e “intersecciones” los 
trataremos conforme a los conceptos y axiomas universales de la teoría 


5 El Axioma del Infinito reaparecerá al final, fortalecido a ultranza, como postulado “me- 


tateórico”. Con respecto a Y tenemos sólo la indicación, en el Axioma del Conjunto 
Potencia, de que cualquiera que sea el conjunto »m, el respectivo conjunto Pm no está 
vacío, sino contiene en cada caso el mismo Urelement arbitrariamente escogido u, 
(“que hace las veces del “conjunto vacío”). Esta no es una aseveración absoluta de 
existencia, pero implica que, si existe un conjunto, existe al menos un objeto que no 
es un conjunto. 


p2 Gracias a que da por supuesto el Axioma de Selección, Zermelo puede enunciar elegan- 


temente su Axioma de Fundación así: Todo conjunto no vacío x contiene un conjunto 
y tal que para todo z € x,z £ y. Cf. Mendelson 1958. 

Cito el Axioma de Separación A (Aussonderung): “Toda función proposicional f(x) 
separa en cada conjunto m un subconjunto m, que contiene todos los elementos x tales 
que f(x) es verdad” (Zermelo 1930, p. 30). En una nota al pie de esa página Zermelo 
explica que la función proposicional f(x) —así como la función de reemplazo en el 
Axioma de Reemplazo— puede ser “enteramente arbitraria”, de modo que “todas las 
consecuencias derivadas de limitar estas funciones a una clase especial caducan desde 
el punto de vista aquí adoptado ”. 
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de conjuntos, exactamente como [si fuesen] conjuntos, ya que no se dis- 
tinguen materialmente (sachlich) de éstos en ningún aspecto esencial; pero 
los llamaremos “dominios” y no “conjuntos” para diferenciarlos de los 
“conjuntos” que son elementos del dominio bajo consideración. 
(Zermelo 1930, p. 31) 


En la terminología de Zermelo, un conjunto bien ordenado m es una secuen- 
cia fundamental (Grundfolge) si el primer elemento de m es un Urelement 
y todo otro elemento m es igual al conjunto de los elementos precedentes. 
Así, una secuencia fundamental es —como un ordinal de von Neumann— un 
conjunto bien ordenado por la relación e. Por lo demás, si convenimos 
con Zermelo en que Y esté representado en cada dominio normal por un 
cierto Urelement fijo u, (véase nota 31), los ordinales de von Neumann son 
secuencias fundamentales. Zermelo demuestra que si un dominio normal D 
contiene un Urelement u y un conjunto bien ordenado r con tipo de orden 
p, D contiene también una secuencia fundamental g, similar a r cuyo primer 
elemento es u.** La totalidad de las secuencias fundamentales con idéntico 
primer elemento u contenidas en un dominio fundamental D constituyen 
un subdominio bien determinado G, de D y sus respectivos tipos de orden 
forman un segmento bien determinado Z, de la serie de los ordinales, con 
tipo de orden S. Pero G, no es uno de los conjuntos de D, ni hay en D un 
conjunto bien ordenado con tipo de orden 0, sino que 6 es el primer ordinal 
mayor que todos los ordinales realizados en D. “De otro modo, se obtendría 
la conocida Antinomia de Burali-Forti” (Zermelo 1930, p. 33). El ordinal ó, 
así descrito, es la característica o número-límite del dominio normal D. A 
continuación explicaré dos propiedades esenciales de tales números-límite 
establecidas por Zermelo. Para aligerar la exposición, adoptaré las defini- 
ciones de ordinal y cardinal de von Neumann (Sección 1.8.4); de acuerdo 
con ellas, “el segmento Z; de la serie de los ordinales determinado por el 
ordinal 0” es precisamente el ordinal $ y un ordinal es un cardinal si no es 
equinumeroso con un ordinal menor. 


A Por el Axioma de Reemplazo: sea u el reemplazante del primer elemento de r; réem- 


placese cualquier otro elemento de r por el conjunto de los reemplazantes de sus 
predecesores. 
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Si Ó es la característica de un dominio normal, Ó es un cardinal 
regular. Esto quiere decir que si Q£ es un ordinal menor que 9, y 6, 
es un subconjunto de Ó tal que (o,,<) es similar a (0,<), entonces 
lol < 16l y hay un ordinal B < 6 tal que o, < B.* 

Se puede definir una aplicación f de la serie de los ordinales en sí 
misma, tal que (a) para cualesquiera ordinales € y E, £(É) < F(O) si 
y sólo si E < €; (b) si OL es un ordinal límite, lim¿..F(E) = F(lim¿..8) 
y (c) si Ó es la característica de un dominio normal, f(0) = O. Esta 
aplicación queda definida por las tres condiciones siguientes: (1) 
F(0) =0; (id) FE + 1) = IP£(E)| para cada ordinal sucesor € + 1, 
y (111) f(0) = lim¿¿F(E) para cada ordinal límite 0:.% 


DEMOSTRACIÓN DE (ID). Sea 6 la característica de un dominio normal D. Si $ no es un 
cardinal hay un ordinal y < 6, tal que ly = 16l. En tal caso, y está realizado en D. Por 
el Teorema de Cantor, lPy > Iyl = 161. Py existe en D (por el Axioma del Conjunto 
Potencia) y admite un buen orden similar a algún ordinal f. Entonces IBl = IPy > 
lÓl, de suerte que $ no es mayor que todos los ordinales realizados en D, contra la 
hipótesis. Por lo tanto, 6 es un cardinal. Supongamos ahora que G es un subconjunto 
de 6 tal que (o,<) es similar a (0,<) para algún ordinal a. < $ y que hay un € e O tal 
que para todo B < 8, PB < E. En tal caso, Uo existe en D (por el Axioma de Unión). 
Pero Uo, por ser la unión de un conjunto de ordinales, también es un ordinal, a saber, 
lim¿.¿¿ = 6. Por lo tanto, Us no puede existir en D. En consecuencia, no existe un O 
C Ó que cumpla la condición señalada. Por lo tanto, 0 es un cardinal regular. 

Con un argumento similar al primero de los anteriores, Zermelo prueba también 
que si Ó es la característica de un dominio normal D, 6 = N, para algún ordinal límite 
a. En efecto, por ser un cardinal, 9 = NX, para algún ordinal Q.. Pero si O fuera un 
ordinal sucesor, O. = € + 1, el cardinal YN, estaría realizado en D y también, por lo 
tanto, el cardinal ¡PX ¿l > N¿,, = Y, = 6, y O no podría ser la característica de D. Por 
consiguiente, QA es un ordinal límite. 


DEMOSTRACIÓN DE (HI). Sea Ó la característica de un dominio normal D. Probaré por 
inducción transfinita (Apéndice VIII) que si Q£ es un ordinal menor que 0, fía) < 6. 
Supongamos que f(É) < $ para todo € < (2. Entonces, para todo € < at, Pf(É) existe 
en D, de modo que f(€ + 1) = IPf(É)I < 8. Por lo tanto, si O. es un ordinal sucesor, 
f(o) < 8. Si a es un ordinal límite, sea a = (f(É): E < a). Como a. está realizado 
en D, o existe en D por el Axioma de Reemplazo y Vo” existe en D por el Axioma 
de Unión. Pero Ua” = lim¿F(E) = fío), de modo que f(a) < $, puesto que es un 
ordinal que está realizado en D. En la demostración de (I) se vio que Ó no puede ser 
un ordinal sucesor. Por lo tanto es un ordinal límite y f(Ó) = limFE). Si ó< f(6) 
habría un o. < 6 tal que f(0) > Ó, contra lo que se acaba de probar. Por lo tanto, $ = 


(5). 
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Las propiedades (I) y (IT) caracterizan a los cardinales inaccesibles.” Se 
los llama así porque, si k es un cardinal de esta especie, no es posible “al- 
canzarlo” a partir de cardinales menores que xk por las operaciones ordinarias 
de formar pares, uniones y conjuntos potencia. No es difícil entender por 
qué la característica 6 de un dominio normal D tenía que ser un cardinal 
inaccesible. D es un modelo de la teoría ZF”, que postula la existencia de 
todo par, unión o conjunto potencia de conjuntos dados, y Ó es el primer 
ordinal mayor que todos los realizados en D. Por lo tanto, si k y A son or- 
dinales menores que 9, IkvVAl, lUkl y IPxl están realizados en D y por ende 
tienen que ser menores que lól = 6. Zermelo recurre reiteradamente a este 
argumento en la demostración de (I) y (ID) (notas 35 y 36). 

La parte central del trabajo de Zermelo (1930) investiga patrones estructura- 
les discernibles en todo modelo de la teoría ZF”. Empieza con esta importante 
caracterización de los submodelos incluidos en un dado modelo: 


Lema: Sea D” un subdominio del dominio normal D. D' es un dominio 
normal si y sólo sí los siguientes objetos pertenecientes a D tam- 
bién pertenecen a D”: (1) cada elemento contenido en un conjunto 
perteneciente a D' y (ii) cada conjunto que sólo contenga elementos 
pertenecientes a D”. Si D' comprende toda la base de Urelemente 
de D, entonces D' = D.* 


dd Hausdorff (1914, p. 131) llamó “exorbitantes” a los ordinales que tienen la propiedad 


(D; hoy suele llamárselos “débilmente inaccesibles”. Zermelo (1930, p. 35) observa 
acertadamente que bajo la Hipótesis Generalizada del Continuo, los números que tienen 
la propiedad (1) también tienen la propiedad (ID): los cardinales débilmente inaccesibles 
también son inaccesibles (en el sentido “fuerte”). El primer ordinal infinito () tiene, 
por cierto, las propiedades (1) y (ID); algunos autores lo excluyen —por convención 
terminológica— de la clase de los cardinales inaccesibles. 


as DEMOSTRACIÓN DEL Lema. Hay que probar que los axiomas de la teoría ZF” se cum- 


plen en D”. Si a y b pertenecen a D”, (a,b) es un conjunto perteneciente a D” (por la 
condición (ii)). Si m es un conjunto perteneciente a D” y m, es el subconjunto de m 
determinado por la condición (, m, pertenece a D”, pues m, es un conjunto de D que 
sólo contiene elementos de m, los cuales pertenecen todos a D” (por (i)). Si m es un 
conjunto de conjuntos perteneciente a D”, todos sus elementos y los elementos de sus 
elementos pertenecen a D” (por (i)); por ende, Um pertenece a D” (por (ii)). Como todos 
los elementos contenidos en un conjunto m perteneciente a D” también pertenecen a D' 
(por (1), todos los subconjuntos de m existentes en D existen en D” (por (ii)); por lo 
tanto, Pm pertenece a D” (por (ii)). Análogamente, se puede mostrar que D” satisface 
el Axioma de Reemplazo, si éste se refiere, como es natural, sólo a sustituciones de 
elementos de un conjunto existente en D” por objetos pertenecientes a D'. 
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Premunido de este resultado, Zermelo establece que todo dominio normal 
D con base U y característica Ó se descompone en una serie bien ordena- 
da de estratos no vacíos y mutuamente disjuntos O,, (A. < 6), tales que un 
objeto x del dominio D pertenece a O, siempre que (i) para cada € < Ql, 
x £ Q; y (ii) para cada y € x, hay un E <a tal que y pertenece a O;. La 
descomposición del dominio normal D en dichos estratos se apreciará mejor 
si prestamos atención a los “segmentos” D,, = Uy... Oy (0 < aL < 9). Tales 
segmentos pueden definirse así: 


(S,) D,=U=0Q),. 

(S.) Si0<0.<Ó, y Q es un ordinal límite, D, = Veo De; si 0 no es 
un ordinal límite, a. = B+1 y Dj,, contiene todos los objetos de D 
cuyos elementos pertenezcan a Ds. 


Si estipulamos que Q, =D, =U y 0, = D,¿MD,(0 < QU < 0), es claro que 
los estratos O, (0. < 6) determinan una partición del dominio D¿= U;.¿ D;. 
Se comprueba fácilmente que D¿ cumple las condiciones del lema. Como la 
base U está incluida en Dj, tenemos que D; = D. 

Especial interés presenta la estratificación del dominio normal D cuando 
es un “dominio unitario” (Einheitsbereich), esto es, cuando su base U consta 
de un solo Urelement. Sea, pues, lUl = 1 y f la aplicación definida en (ID. 
Entonces, para cada Q£ < Ó, tenemos que (i) 1D,l = If(0)l; (11) si x es un 
conjunto perteneciente a D,, lrl < ID |; (111) en el estrato correspondiente 
O, hay algún conjunto x tal que lxl = 1D,l; (tv) cada subdominio de D, es 
un conjunto en D,,,, y (v) si A es un ordinal límite, todos los segmentos 
D; (€ < 01) y sus respectivos subdominios son conjuntos en D,. Además, |DI 
= 0 y cualquier subdominio de D que sea menos numeroso que D es un 
conjunto perteneciente a D. Según esto, si D es un dominio normal unitario, 
D satisface el Axioma IV.2 de von Neumann, según el cual una colección de 
objetos es “demasiado grande” para ser un conjunto sólo si es tan numerosa 
como todo el universo de objetos. Zermelo subraya que un modelo de ZF” 
que tenga más de un Urelement no satisface ese axioma de von Neumann 
(1930, p. 38). Muestra asímismo que cualquier dominio normal D admite 
una “estratificación canónica”, cuyos “segmentos canónicos” se definen por 
las estipulaciones siguientes: 


108 El Paraíso de Cantor 


(C,) D, = U= Q, (como $). 

(C.,) Si 0 < 0. < 6, y A es un ordinal límite, D,, = U;.., D¿; si QL no es un 
ordinal límite, € = B+1 y D;,, contiene cada objeto x de D cuyos 
elementos pertenecen a D,, y cuyo cardinal lxl <= If(a1)! —donde f 
es la aplicación definida en (ID. 


Si D es un dominio unitario, (C,) equivale a (S,), de modo que D no admite 
otra estratificación que ésta. La estratificación canónica le sirve a Zermelo 
para establecer que las propiedades (I) y (II) son no sólo necesarias sino 
también suficientes para que un dominio sea “normal” (esto es, para que sea 
un modelo de ZF”). También se utiliza en la demostración de los teoremas 
de isomorfismo a que aludí al comienzo y enunciaré con mayor precisión 
ahora. Sea U, la base y O, la característica de un dominio normal D, (k = 
1, 2). Teorema 1. Si lU,l = lU,l y 6, = 6,, D, y D, son isomórficos y una 
biyección q: U, => U, determina un isomorfismo único D, => D,. Teorema 
II. Si 1U,l =1U,| y 6, < 9,, D, es isomórfico a un segmento canónico de D,. 
Teorema MI. Si 0, = Ó,, o bien D, es isomórfico a un subdominio (propio o 
impropio) de D, o bien D, es isomórfico a un subdominio (propio o impro- 
pio) de D,. De la segunda parte del teorema I, Zermelo deduce fácilmente 
que el grupo de automorfismos de un dominio normal es isomórfico (como 
grupo) al grupo de permutaciones de su base. 

En la última sección de su trabajo, Zermelo aborda “cuestiones de existen- 
cia, consistencia y categoricidad”, bajo el supuesto de que el sistema ZF” 
no implica contradicciones. Este supuesto no se ha demostrado, pero puede 
aceptarse como plausible mientras no se derive una contradicción de los 
axiomas BAPUVEF (y ninguna ha sido derivada hasta la fecha). Zermelo da, 
entonces, por descontado que existe un dominio normal D con característi- 
ca Ó y una base no especificada U. El teorema III de isomorfismo implica 
que si U” es una parte propia de U existe un dominio normal D” con base 
U”. En cambio, como no todo ordinal es un “cardinal inaccessible” con las 
propiedades (I) y (ID), una variación de la característica Ó no genera auto- 
máticamente un nuevo dominio normal. Ni siquiera es claro que haya tales 
“cardinales inaccesibles”, ni, si los hay, cuántos son. 

El primer ordinal que reúne las propiedades (1) y (ID) es (0. Digamos que 
un objeto m existente en D envuelve el infinito si m es un conjunto infinito 
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o si hay en D n conjuntos a,, a,....,a, tales que a, es infinito y a, € a, 
€... € a, =m(n2 1). El segmento D,, de la estratificación canónica de D 
comprende precisamente todos los objetos de D que no envuelven el infinito. 
D,,es un dominio normal con característica (. Por lo tanto, si ZF” tiene un 
modelo cualquiera D también tiene un modelo D” con característica (0. La 
existencia de este modelo “finitista” —que Zermelo piensa que no será dispu- 
tada ni siquiera por los peores adversarios de la teoría de conjuntos— basta 
al menos para probar que la teoría ZF” es consistente. Pero, “justamente 
porque no contiene ningún conjunto infinito, no se lo puede ser aducir 
como un “modelo” genuino de la teoría de conjuntos cantoriana” (1930, p. 
44). El Axioma del Infinito de Zermelo (1908a), al postular la existencia de 
un conjunto similar a (0, supera los límites del modelo descrito. Si hay un 
modelo de ZF” que satisfaga este axioma, esto es, un dominio normal D en 
que el ordinal (wm esté realizado, su característica es el primer cardinal regular 
k que sea un punto fijo de la función f definida en (ID, en otras palabras, 
que satisfaga la ecuación f(k) = k. Pero es sensato preguntar: ¿existe acaso 
un ordinal k > () que tenga estas propiedades? 

He aquí las consideraciones en que Zermelo basa su respuesta afirmativa 
a esta pregunta. Si D es un dominio normal con característica k, no exis- 
te en D ningún conjunto bien ordenado similar a k, ni en general ningún 
conjunto equinumeroso con K. Por otra parte, la totalidad de las secuencias 
fundamentales con idéntico Urelement inicial existentes en D tiene precisa- 
mente el cardinal Ikl y forma una secuencia bien ordenada similar a k. Pero 
¿tenemos derecho a profesar que dicha totalidad existe como tal, si existe 
el dominio normal D? Zermelo recuerda que si se fija la característica y el 
cardinal de la base de un dominio normal D, la teoría ZF” determina a D 
“categóricamente” (es decir, ZF” determina sin ambigiiedades la clase de 
todos los dominios normales isomórficos a D). Por lo tanto, si adoptamos “la 
hipótesis general de que todo dominio categóricamente determinado puede 
ser también concebido de algún modo como “conjunto”, es decir, que puede 
presentarse como elemento de un dominio normal (apropiado), resulta que a 
cada dominio normal corresponde otro superior con la misma base, a cada 
dominio unitario un dominio unitario superior, y así a cada 'número-límite” 
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Tr corresponde también un número-límite mayor Tr” (1930, p. 46).** Esta re- 
flexión se aplica también a cualquier totalidad categóricamente determinada 


de “números-límite”, de modo que la serie de éstos números es tan ilimitada 


como la de los ordinales y a cada ordinal transfinito corresponde biunívo- 
camente un cardinal inaccesible. 


Naturalmente, esto no es una consecuencia “demostrable” de los axiomas 
ZF', ya que la situación aseverada trasciende cada dominio normal parti- 
cular. Más bien hay que postular la existencia de una serie ilimitada de 
números-límite como un nuevo axioma para la “metateoría de conjuntos” 
(fúr die “Meta-Mengenlehre”). 

(Zermelo 1930, p. 46) 


La nueva visión de la teoría de conjuntos arroja luz también sobre las 


paradojas en que se ceban los “antimatemáticos”: 


39 


Estas aparentes “contradicciones” descansan meramente en una confusión 
de la teoría de conjuntos misma, no determinada categóricamente por sus 
axiomas, con los modelos particulares que la representan: lo que en un 
modelo aparece como un “no-conjunto o superconjunto ultrafinito” (“ul- 
trafinite Un- oder Ubermenge”) es ya en el modelo superior siguiente 
un “conjunto” plenamente válido con número cardinal y tipo de orden, y 
constituye el cimiento sobre el cual se edifica el nuevo dominio. A la serie 


El lector habrá advertido que Zermelo formula su “hipótesis general” en dos versiones 
tales que la primera es plausible, pero la consecuencia buscada sólo se infiere de la 
segunda, a saber: 


() 


(2) 


Todo dominio categóricamente determinado puede ser también concebido de 
algún modo como “conjunto” (“irgendwie auch als “'Menge” aufgefaft werden 
kann” —cursiva mía). 

Todo dominio categóricamente determinado puede presentarse como elemento de 
un dominio normal idóneo (“als Element eines (geeignet gewáhlten) Normalbe- 
reiches auftreten kann”). 


Aunque en el texto de Zermelo van unidos por la expresión “es decir” (das heift), 
los asertos (1) y (2) no dicen lo mismo, y no es posible establecer su equivalencia 
lógica sin premisas adicionales. “Conjunto” se usa en (1) en su significado “ingenuo” 
ordinario, y no está dicho que sólo un objeto que se llame “conjunto” en un modelo 
de la teoría ZF' sea admisible como ejemplo ilustrativo de ese significado. 
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ilimitada de los ordinales cantorianos corresponde pues una doble serie 
igualmente ilimitada de modelos esencialmente distintos de la teoría de 
conjuntos, en cada uno de los cuales se expresa íntegra la teoría clásica. 
Las dos tendencias polarmente opuestas del espíritu que piensa, la idea del 
progreso creador y la de la conclusión abarcadora, que también subyacen 
a las “antinomias” kantianas, están representadas y reconciliadas simbó- 
licamente en el concepto de la serie transfinita de los números, basada en 
el buen orden, la cual en su progreso sin límites no tiene una verdadera 
conclusión, pero sí estaciones, a saber, justamente esos “números-límite” 
que separan los tipos de modelo superiores de los inferiores. Y así las 
“antinomias” de la teoría de conjuntos, bien entendidas, conducen a la 
ciencia matemática no a un estrechamiento y mutilación, sino más bien 
a un despliege y enriquecimiento que aún es imposible abarcar con la 
mirada. 

(Zermelo 1930, p. 47) 
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CÁLCULOS 


2.1 EL PROGRAMA DE HILBERT 


Hacia 1920, David Hilbert, entonces en la cima de su fama, se embarcó re- 
sueltamente en un nuevo programa de fundamentación de las matemáticas. 
Más tarde, ante la Sociedad Filosófica de Hamburgo, explicará su propósito, 
lapidariamente, así: 


Con esta nueva fundamentación de las matemáticas persigo un fin im- 
portante: Al hacer de cada enunciado matemático una fórmula que pueda 
exhibirse en concreto y derivarse con rigor y al darle así a las conceptua- 
lizaciones e inferencias matemáticas una forma tal que resulten irrefuta- 
bles y a la vez proporcionen una representación de la ciencia [matemáti- 
ca] entera, yo quisiera eliminar definitivamente del mundo la cuestión de 
los fundamentos de las matemáticas. 

(Hilbert 1931, p. 489; cursiva mía) 


Su interés en el asunto no era nuevo. En 1899 había publicado la prime- 
ra axiomatización adecuada de la geometría euclidiana.' Al año siguiente 
apareció su caracterización axlomática del cuerpo de los reales, que reem- 
plaza —y vindica— las definiciones clásicas de los números reales como 
colecciones infinitas de racionales (Hilbert 1900).? Dos cuestiones de funda- 
mentos encabezan la lista de problemas para el siglo XX que planteó ese 
mismo año al Primer Congreso Internacional de Matemáticos, reunido en 
París: el problema cantoriano de la cardinalidad del continuo y la consisten- 


En la Sección 1.8.1 me referí brevemente a esta obra. Mario Pieri (1899) publicó casi 
al mismo tiempo otra axiomatización de la geometría clásica, muy diferente de la de 
Hilbert, pero no menos idónea. 


1) 


Los axiomas de Hilbert definen el sistema de los reales como un cuerpo arquimédico 
completo (véase el Glosario, s.v. “cuerpo”). Las definiciones clásicas de Weierstraf, 
Méray, Dedekind y Cantor determinan sendos modelos (realizaciones) de esta especie 
de estructura. Como todos los modelos de un cuerpo arquimédico completo son 
isomórficos, dichas definiciones pueden aceptarse como equivalentes. 
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cia? de “los axiomas aritméticos”, expresión con la que designa a los axio- 
mas de la teoría de los reales. La importancia de este último problema se 
puede explicar así: Varias pruebas propuestas en el siglo XIX referían la 
consistencia de una teoría dudosa a la de otra teoría incuestionada. 
Lobachevsky, por ejemplo, había mostrado que las fórmulas trigonométricas 
de su geometría no-euclidiana podían generar una contradicción sólo si la 
trigonometría esférica euclidiana era inconsistente. El mismo Hilbert (1899) 
había probado que su axiomatización de la geometría euclidiana no era in- 
consistente a menos que la teoría de los números reales también lo fuera. 
Con ello, ancló las anteriores pruebas de consistencia relativa en la consis- 
tencia de la aritmética. Ésta tendría que demostrarse directamente, estable- 
ciendo la imposibilidad, no condicional, sino absoluta de inferir una contra- 
dicción de sus axiomas. Ante el Tercer Congreso Internacional, celebrado en 
Heidelberg, Hilbert (1904) explicó a grandes rasgos cómo habría que proce- 
der a tal demostración directa. Esta ponencia, que manifiestamente subesti- 
ma la dificultad de la empresa, adelanta ya algunos planteamientos y méto- 
dos característicos de su programa de los años 20.* Pero su renovado interés 
en el tema fue motivado al parecer por las críticas de Brouwer (1907, 1912) 
y de Weyl (1921) a la fundamentación conjuntista del análisis y el consi- 
guiente rechazo por parte de estos eminentes matemáticos de la metodología 
matemática habitual. 

La filosofía matemática de Brouwer y Weyl cae fuera de los límites de 
este libro. Pero para apreciar los motivos y la orientación del programa de 
Hilbert no es preciso conocer el pensamiento de estos autores, sino solamen- 
te la idea que se hacía al respecto el propio Hilbert (quien, al parecer, no 


u 


Hilbert dice “Widerspruchslosigkeit”, literalmente, “carencia de contradicción”. Un sis- 
tema de axiomas tiene esta propiedad si es imposible derivar de él aseveraciones con- 
tradictorias “mediante un número finito de inferencias lógicas” (Hilbert 1900a; GA, 
III, 300). En adelante, usaré siempre los sustantivos “consistencia”, “inconsistencia” (así 
como los correspondientes adjetivos “consistente”, “inconsistente”) en esta acepción. Más 
adelante habrá oportunidad de precisar —de distintas maneras en diferentes casos— lo 
que se admite como “inferencia lógica”. Otros autores llaman “consistente” a una teo- 
ría, axiomatizada o no, si admite una realización o modelo. Para evitar confusiones, 
usaré siempre las palabras “realizable”, “realizabilidad” para referirme a esta propiedad 
de las teorías (o de sus axiomas). 


Me referiré a Hilbert 1904 en la Sección 2.9.2, donde dispondremos de más elementos 
de juicio para apreciar sus propuestas. 
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puso demasiado empeño en entenderlos).? En su primer trabajo sobre el nuevo 
programa, se expresa así: 


[Weyl y Brouwer] buscan fundamentar la matemática arrojando por la 
borda todo lo que les parece incómodo y erigen una Dictadura de la Pro- 
hibición 4 la Kronecker. Con ello, empero, desmiembran y mutilan nues- 
tra ciencia, y corremos el peligro de perder gran parte de nuestros más 
valiosos tesoros si seguimos a tales reformadores. Weyl y Brouwer pros- 
criben los conceptos generales de número irracional y de función, inclusi- 
ve de función aritmética, los números cantorianos de las clases superiores 
de números, etc.; también el teorema según el cual entre infinitos núme- 
ros naturales siempre hay uno menor que los demás, e incluso el princi- 
pio lógico “Tertium non datur”, por ejemplo, en la aseveración: o bien 
hay sólo un número finito de números primos o hay infinitos. Estos son 
ejemplos de proposiciones e inferencias prohibidas. Creo que así como 
Kronecker no logró suprimir el número irracional —Weyl y Brouwer per- 
miten al menos conservar un muñón— tampoco Weyl y Brouwer tendrán 
éxito. No. Brouwer no es la revolución, como cree Weyl, sino sólo la 
repetición, con recursos viejos, de un amago de putsch que antes falló 
totalmente aunque fue intentado con mucha más decisión, y que, ahora 
que el poder del estado ha sido tan bien equipado y fortalecido por Frege, 
Dedekind y Cantor, está de antemano condenado al fracaso. 

(Hilbert 1922; GA, III, 159s.) 


A mi modo de ver, el desacuerdo entre Kronecker y Cantor reside, en lo 
esencial, en esto: Kronecker exigía que toda definición matemática incluyera 
un método para decidir efectivamente a cuáles objetos se aplicaba y a cuáles 
no: en cambio, Cantor no tenía inconveniente en reconocer que una colec- 


El lector curioso encontrará en el Apéndice XIX un esbozo de las ideas de Brouwer 
contra las que reacciona Hilbert. Allí podrá comprobar que la parte positiva de la en- 
señanza de este autor no ha sido criticada por Hilbert, quien sólo buscó proteger a la 
matemática clásica contra su escepticismo, mediante una nueva e irrebatible 
fundamentación. 


Kronecker difundía su concepción de las matemáticas desde su influyente cátedra en la 
Universidad de Berlín. De sus escritos, el más filosófico es tal vez el ensayo “Sobre el 
concepto de número” (1887), pero en él no figura la exigencia arriba mencionada. Pero 
el siguiente pasaje, tomado de un trabajo de Kronecker de 1882, la aplica muy clara- 
mente en un caso especial: “La citada definición de irreducibilidad carecerá de un fun- 
damento seguro mientras no se indique un método mediante el cual se pueda decidir, 
ante una función determinada dada, si ella es o no irreducible conforme a dicha defi- 
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ción de objetos existe y está completamente determinada, aunque no haya 
un inventario de sus elementos o un método efectivo para generarlo. Al igual 
que Kronecker, Brouwer y sus partidarios rechazan este supuesto. Por eso, 
no pueden aceptar la idea moderna de aplicación (función) como corres- 
pondencia arbitraria entre conjuntos, ni la identificación de los números 
irracionales con secuencias de racionales (no convergentes en ()), ni los 
ordinales transfinitos de Cantor. En ese rechazo se basa también la prohibi- 
ción de invocar el Principio del Tercero Excluido o Tertium non datur en las 
demostraciones referentes a colecciones infinitas.” En efecto: supongamos que 
el mero enunciado de una condición no contradictoria C no basta para deter- 
minar la colección de los objetos que son C; entonces, aunque se pruebe que 
es falso que todos los C cumplen además una cierta condición D, no se habrá 
establecido que existe un objeto x que es C pero no es D; para certificar la 
existencia de tal objeto hay que presentarlo o, al menos, presentar un méto- 
do para construirlo. 

Hilbert, en cambio, entiende de muy distinta manera lo que un matemáti- 
co puede y debe admitir como existente. Como le hace presente a Frege en 
la misma carta del 29 de diciembre de 1899 que cité en la Sección 1.8.1: 


Si los axiomas arbitrariamente estipulados, junto con todas sus conse- 
cuencias, no se contradicen entre sí, entonces son verdaderos y existen las 
cosas definidas por ellos. Ese es para mí el criterio de la existencia y de 
la verdad. 

(Frege, KS, p. 411) 


En otras palabras, si el matemático caracteriza un sistema de objetos me- 
diante una serie de condiciones mutuamente compatibles (esto es, mediante 
condiciones que no se contradigan explícitamente y no impliquen consecuen- 


nición” (citado por O. Becker 1954, p. 328, de Kronecker, “Grundziige einer 
arithmetischen Theorie der algebraischen Gróssen”, $ 4). 


El Principio del Tercero Excluido afirma que cualquier aseveración p es verdadera o es 
falsa: no hay una tercera alternativa (non datur tertium); simbólicamente: p v —p. Apli- 
cado a un predicado I' atribuible a los elementos de un conjunto caracterizado por un 
predicado A, el Principio afirma que, o bien todos los elementos del conjunto (x: Ax) 
son IP, o bien alguno de ellos no es I”; simbólicamente: 


Vx(Ax > I'x) v Ix(Ax an —=1x) 
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cias contradictorias), tiene que reputar existente a cualquier objeto cuya per- 
tenencia al sistema se infiera de dichas condiciones. Hilbert le da un giro un 
tanto distinto a esta idea en la citada ponencia ante el Congreso de París: 


Si a un concepto se le asignan características contradictorias, digo que ese 
concepto matemáticamente no existe. [ ... ] Pero si se logra demostrar que 
las características asignadas al concepto no pueden conducir jamás a una 
contradicción mediante la aplicación de un número finito de inferencias 
lógicas, digo que con ello se ha demostrado la existencia matemática del 
concepto (por ejemplo, de un número o una función que cumple ciertos 
requisitos). 

(Hilbert 1900a; GA, III, 301-302) 


Esta noción de existencia conceptual ad usum mathematicorum concuerda 
hasta cierto punto con lo que Cantor llamaba la “realidad inmanente” de los 
objetos matemáticos (Capítulo 1.6). Como en este punto Hilbert discrepa 
absolutamente de Brouwer y los suyos, su polémica con ellos estaba de an- 
temano destinada a ser un diálogo entre sordos.? Pero el propósito de Hilbert 


Cantor exigía además que todo nuevo sistema introducido mediante una caracteriza- 
ción consistente estuviese firmemente arraigado en la tradición matemática. En sus pa- 
labras: los nuevos conceptos deben “estar en relaciones firmes, ordenadas mediante de- 
finiciones, con los conceptos previamente formados, ya existentes y probados” (Can- 
tor, GA, p. 182; citado en la Sección 1.6). Podría decirse que Hilbert introduce una 
exigencia similar cuando compara un problema matemático nuevo —especialmente cuan- 
do lo suscita la investigación de la naturaleza— con “una ramita joven que sólo pros- 
pera y da fruto si se la injerta cuidadosamente según las reglas rigurosas del arte del 
jardinero en el tronco viejo, el seguro patrimonio de nuestro saber matemático” (1900a; 
GA, IIL, 293s.). 

Van Dalen (1990) narra cómo Hilbert, que era el director de Mathematische Annalen, 
hizo sacar a Brouwer de la lista de colaboradores distinguidos impresa en la portadilla 
de la revista —donde figuró desde 1915 hasta 1928— porque, según le notificó, “no 
me es posible colaborar con usted, dada la incompatibilidad de nuestros puntos de vis- 
ta sobre cuestiones fundamentales”. Una conferencia dictada por Hilbert en 1928 ante 
el Seminario Matemático de Hamburgo, contiene la siguiente indisimulada alusión a 
Brouwer: “Quitarle al matemático el tertium non datur sería como querer prohibirle el 
telescopio al astrónomo o el uso de los puños al boxeador. La prohibición de las ase- 
veraciones existenciales y el tertium non datur viene a ser más o menos lo mismo que 
la renuncia a la ciencia matemática en general. [... ] Me asombra que un matemático 
ponga en duda la validez rigurosa del modo de inferencia basado en el tertium non 
datur. Más me asombra que, al parecer, se haya formado ahora toda una comunidad de 
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no era quizás traerlos de vuelta al redil, sino sólo neutralizar de una vez por 
todas el efecto descorazonador que sus objeciones pudieran tener sobre los 
buenos matemáticos. En interés de la matemática misma, pero también de 
toda nuestra cultura, quiere establecer que “las proposiciones matemáticas 
de hecho son verdades inexpugnables y definitivas” (1922; GA, III, 162).'% 
La incertidumbre que todavía prevalece al respecto se debe, según él, a que 
los estudios sobre los fundamentos de las matemáticas realizados hasta en- 
tonces 


no permiten reconocer un camino que haga posible formular cada cues- 
tión relativa a los fundamentos de tal modo que tenga que ir seguida de 
una respuesta unívoca. Pero esto es justamente lo que reclamo: En princi- 
pio, en asuntos matemáticos, no deben tener cabida las dudas, ni las me- 
dias verdades, ni las verdades esencialmente heterogéneas (es soll in 
mathematischen Angelegenheiten prinzipiell keine Zweifel, es soll keine 
Halbwahrheiten und auch nicht Wahrheiten von prinzipiell verschiedener 
Art geben kónnen). 

(Hilbert 1922; GA, II, 157) 


Como Hilbert (1899) había demostrado que su axiomatización de la geo- 
metría no es contradictoria a menos que el concepto clásico de número real 
lo sea, la certeza indisputable que Hilbert demanda se habrá logrado, a sus 


matemáticos que lo hace. Pero sobre todo me asombra el hecho de que incluso entre 
matemáticos el poder de sugestión de un solo hombre ingenioso y temperamental (die 
Suggestivkraft eines einzelnen temperamentvollen und geistreichen Mannes) sea capaz 
de ejercer los efectos más excéntricos y más inverosímiles” (Hilbert 1928; GG”, p. 307). 


Más de una vez Hilbert ha descrito su programa como una cruzada cultural. Por ejem- 
plo, en su alocución al Congreso de Matemáticos de Bologna: 


¿En qué pararía la verdad de nuestro saber en general y la existencia y el progre- 
so de la ciencia si ni siquiera en las matemáticas hubiese una verdad segura? Y en 
efecto, hoy por hoy, el escepticismo y el desánimo con respecto a la ciencia sue- 
len expresarse incluso en la literatura especializada y en conferencias públicas. 
Esto es como una especie de ocultismo, que juzgo dañina. La Teoría de la Prueba 
hace imposible tal actitud y nos procura la convicción entusiasta de que al menos 
el entendimiento matemático no tiene límites y puede incluso rastrear las leyes 
del pensamiento mismo. 

(Hilbert 1928a, en GG”, p. 323) 
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ojos, en cuanto dispongamos de una teoría consistente de los reales. Equipa- 
rando los reales con ciertos conjuntos infinitos de racionales, los conjuntistas 
intentaron fundar una teoría de los reales por lo menos tan consistente como 
la aritmética. Según Brouwer y Weyl, las paradojas de la teoría de conjuntos 
han puesto en evidencia la futilidad de ese intento. Hilbert no comparte esta 
manera de ver: 


El hecho de que el concepto de conjunto en el sentido más general no sea 
admisible sin más no excluye de ningún modo que el concepto de un 
conjunto de números enteros sea correcto. Y las paradojas de la teoría de 
conjuntos no pueden considerarse como una prueba de que el concepto de 
conjunto de números enteros lleva a contradicciones. Al contrario: todas 
nuestras experiencias matemáticas respaldan la corrección y la consisten- 
cia de este concepto. 

(Hilbert 1922; GA, III, 158) 


Hilbert alude además a su propia axiomatización de la teoría de los reales 
(1900), que los caracteriza sin recurrir al concepto de conjunto de enteros.!! 
Sus axiomas son suficientes para fundamentar el análisis. En este campo, 
“no obstante las más osadas y diversas combinaciones y el uso de los méto- 


Según Hilbert, gracias a su caracterización axiomática “las dudas que en general se 
han hecho valer contra la existencia del agregado (Inbegriff) de todos los números rea- 
les y de conjuntos (Mengen) infinitos en general pierden toda su justificación [ ... ]: el 
conjunto de los números reales no tiene que concebirse ahora, digamos, como la tota- 
lidad (Gesamtheit) de las leyes que pueden gobernar la sucesión de los términos de 
una secuencia de Cauchy (Fundamentalreihe), sino más bien [...] como un sistema 
(System) de cosas cuyas relaciones mutuas están dadas por el sistema finito y cerrado 
de los Axiomas I-IV [que caracterizan un cuerpo arquimédico completo] y sobre los 
cuales valen otras aseveraciones sólo si uno puede derivarlas de esos axiomas me- 
diante un número finito de inferencias lógicas” (1900; GG”, p. 246). He puesto en 
cursiva la cláusula final (el original destaca sólo las tres palabras correspondientes a 
“finito y cerrado”) porque tendré que referirme a ella más adelante. En el pasaje para- 
lelo de Hilbert 1900a está expresada en forma aún más drástica así: “El continuo [en 
la concepción axiomática es] un sistema de cosas cuyas relaciones mutuas están regu- 
ladas por los axiomas establecidos y con respecto a las cuales son verdaderos todos los 
hechos y solamente los hechos que se pueden deducir de los axiomas mediante un nú- 
mero finito de inferencias lógicas (fiir welche alle und nur diejenige Tatsachen wahr 
sind, die durch eine endliche Anzahl logischer Schlisse aus den Axiomen gefolgert 
werden kónneny” (GA, IL, 301). 
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dos más refinados, reina una total seguridad en las inferencias y una concor- 
dancia patente de todos los resultados” (Hilbert 1922; GA, III, 159), y por 
lo tanto se justifica aceptar los axiomas que cimientan esa seguridad y con- 
cordancia. “Disputar esa justificación sería privar de antemano a toda cien- 
cia de la posibilidad de operar” (ibid.). Subsiste, con todo, el problema de 
probar la consistencia de los axiomas. Este es justamente el problema que 
Hilbert quiere resolver con su nuevo programa. 

Contestando a la citada carta de Hilbert (del 29.X11.1899), Frege se pre- 
gunta qué medios hay para demostrar que ciertas propiedades o requisitos 
no se contradicen mutuamente. Responde así: 


El único que conozco es este: Exhibir un objeto que posea todas esas 
propiedades, indicar un caso en que se cumplan todos esos requisitos. No 
sería posible demostrar la consistencia (Widerspruchslosigkeit) por otra vía. 

(Frege, KS, p. 414) 


Obviamente es inútil aducir la consistencia de un conjunto de axiomas como 
criterio de la existencia de un sistema de objetos caracterizado por él, si para 
cerciorarse de aquélla hay que tener a éstos por delante. Pero el programa 
de Hilbert se encamina a demostrar directamente la imposibilidad de inferir 
una contradicción de las teorías axiomáticas que le interesan. Ello presupo- 
ne, por cierto, que se conozcan con precisión todas las formas de inferencia 
legítimas, así como la estructura de las conclusiones que ellas permiten de- 
ducir de cada clase tipificable de premisas. En este aspecto esencial el pro- 
grama de Hilbert se apoya en la formalización de la lógica y las matemáti- 
cas emprendida por el propio Frege y perfeccionada por Russell y Whitehead. 
En los Capítulos 2.2-2.4 hablaré de las motivaciones y principales logros de 
esa empresa. Pero antes debo redondear este capítulo introductorio con algu- 
nas indicaciones generales sobre la función que desempeñan en el programa 
de Hilbert. 

En Principia Mathematica (1910-13), Whitehead y Russell mostraron que 
todas las proposiciones clásicas de la aritmética y el análisis pueden enun- 
ciarse en la escritura ideográfica, de sintaxis simple y precisa, desarrollada 
por ellos. En su sistema lógico-matemático las inferencias desde premisas 
formuladas en esa escritura se ajustan a unos pocos patrones fácilmente 
reconocibles. Utilizando esos patrones, de un par de premisas contradicto- 
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rias puede deducirse cualquier conclusión.!? El programa de Hilbert se basa 
en esto. Hilbert piensa que una vez que los axiomas cuya consistencia inte- 
resa demostrar se han enunciado en la escritura canónica podemos desaten- 
der por completo lo que se quería decir con ellos (olvidar, por ejemplo, que 
intentábamos referirnos al infinito actual). La única tarea pendiente consiste 
en probar que hay por lo menos una oración que no se puede deducir de los 
axiomas. Específicamente, es preciso demostrar que es imposible que cierta 
fórmula de la escritura canónica—por ejemplo, un enunciado de la igualdad 
“0 = 1”— ocupe el último lugar en una lista de tales fórmulas cada una de 
las cuales es un axioma o se deduce de una o más de sus predecesoras en la 
lista conforme a uno de los patrones de inferencia del sistema. Tal demostra- 
ción, claro está, debe efectuarse de manera que no deje lugar a dudas y que 
no invite, a su vez, a probar la consistencia de los recursos utilizados en 
ella. Para ello es necesario y suficiente, según Hilbert, que la demostración 
requerida se conduzca enteramente en el ámbito de lo que él llama la ““pos- 
tura finita” (finite Einstellung) o el “punto de vista finito” (finiter Standpunkt). 

De este modo, Hilbert, sin renunciar al transfinito cantoriano, trata de ha- 
cerlo inofensivo reduciéndolo a ser nada más que el referente ideal —y olvida- 
ble— de ciertos símbolos que el matemático puede y debe utilizar como si 
no significaran nada. Ello implica reemplazar lo que Hilbert llama el “razo- 
namiento sustantivo” (inhaltliches Schliefien), expresado en alemán o caste- 
llano, que se hace pensando en aquello sobre lo cual se discurre, por un tipo 
de razonamiento puramente formal, que, sin pensar, manipula filas de signos 
de la escritura ideográfica conforme a reglas que conciernen únicamente a 
su aspecto y no a su significado.!? Esto no quiere decir, sin embargo, que 
Hilbert auspicie una matemática no-pensante. A la matemática “clásica”, que 


2 Sea —a la negación de una oración a. Sea [3 otra oración cualquiera. De la premisa a. 
es lícito inferir (B > a). De las premisas (B > a) y —a es lícito inferir PB. Por lo 
tanto, de las premisas aL y —0L, puede inferirse la conclusión $. 

“Obtenemos así, en lugar de la ciencia matemática sustantiva (inhaltlich), trasmitida en 
el lenguaje corriente, un caudal de fórmulas con signos matemáticos y lógicos, que se 
ponen en fila según ciertas reglas. A los axiomas matemáticos corresponden algunas de 
las fórmulas y a la inferencia sustantiva (inhaltliches Schliefen) corresponden las re- 
glas conforme a las cuales las fórmulas se suceden unas a otras. La inferencia sustantiva 
es reemplazada, pues, por un operar extrínseco según reglas... ” (Hilbert, 1925; GA, 
Il, 177). El vocablo alemán inhaltlich que traduzco por “sustantivo, a”, se deriva de 
Inhalt, *contenido” y significa literalmente “propio del contenido”, “relativo al conteni- 
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se trata de hacer inmune a la crítica aunque sea al precio de exonerarla del 
pensamiento, viene ahora a agregarse una “meta-matemática”: la Teoría de 
la Prueba (Beweistheorie), que estudia sistemáticamente el razonamiento 
formal y servirá para establecer que éste no podrá nunca generar una contra- 
dicción dentro de la matemática formalizada. La Teoría de la Prueba razona 
“sustantivamente”, pensando en lo que dice; pero, como trata sólo de signos 
que son marcas fácilmente reconocibles de tinta o de tiza y de reglas sim- 
ples para combinar esas marcas en filas y en columnas, se mantiene, según 
Hilbert, dentro de la “postura finita” y no corre el riesgo de contradecirse.!* 

Hilbert nunca hizo un inventario de los recursos accesibles a la “postura 
finita” ni los caracterizó mediante una definición precisa. Pero los ejemplos 
que ofrece en los artículos en que anuncia y defiende el programa, la exi- 
gencia de que la prueba de consistencia sea inequívoca e incuestionable, y 
el mismo adjetivo “finito” empleado para describirlos dan, creo, una idea bas- 
tante clara de la índole y alcance de esos recursos. Parece obvio, por ejem- 
plo, que el matemático en “postura finita” no podrá contemplar la existencia 
de un conjunto cerrado de objetos actualmente infinito, sino a lo sumo se- 
cuencias abiertas, potencialmente infinitas. Al razonar sobre éstas, se absten- 
drá de invocar el Principio del Tercero Excluido. Como anota von Neumann: 
“El demostrar sustantivo debe desarrollarse en completo acuerdo con la ló- 
gica intuicionista de Brouwer y Weyl. La Teoría de la Prueba debe edificar, 
por decirlo así, la matemática clásica sobre una base intuicionista y de este 


do”. Por eso el término hilbertiano inhaltlich se ha solido traducir al inglés por 
“contentual”, un neologismo que es feo en ese idioma y sería prácticamente ininteligi- 
ble en el nuestro. Me parece en cambio que el contraste que hacemos en castellano 
corriente (no filosófico) entre la “mera forma” y la “sustancia” de un asunto justifica 
mi traducción de inhaltlich. 

Von Neumamn (1927, pp. 1-2) describe estos dos tipos de razonamiento con insupera- 
ble claridad: 


Hay que distinguir tajantemente entre dos modos diferentes de “demostrar”: El 
demostrar formalista (“matemático”) dentro del sistema formal y el demostrar 
sustantivo (“metamatemático”) concerniente al sistema. Mientras aquél es un jue- 
go lógico definido arbitrariamente (aunque tiene que ser, por cierto, en buena 
medida análogo a la matemática clásica), éste consiste en un encadenamiento de 
intuiciones sustantivas (inhaltlicher Einsichten) inmediatamente evidentes. 
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modo reducir al absurdo el intuicionismo estricto” (1927, p. 2).** 

La insistencia en que las teorías matemáticas bajo estudio se formulen en 
una escritura canónica similar la adoptada en Principia Mathematica obede- 
ce, sobre todo, a que entonces —como ha señalado Kreisel— la cuestión de 
su consistencia se torna “finita” en el sentido preciso siguiente: “Dadas las 
reglas formales y, por lo tanto, en particular, la lista (finita) de símbolos a 
utilizar, uno puede decidir con respecto a cualquier secuencia de “palabras” 
(= fórmulas) si está construida de acuerdo con las reglas y si contiene o no 
palabras de la forma a y —a, donde el símbolo — se usa para expresar la 
negación” (Kreisel 1976, p. 94). Este es el objetivo de las tres primeras ta- 
reas que von Neumann asigna a la Teoría de la Prueba en la ponencia que 
leyó como portavoz del grupo de Hilbert en el simposio sobre fundamentos 
de la matemática celebrado en Kónigsberg en septiembre de 1930 (en que 
también hablaron Heyting, por la escuela de Brouwer, y Carnap, por el 
logicismo a la Frege-Russell favorecido en el Círculo de Viena): 


1. Enumerar todos los símbolos empleados en la matemática y la lógica. 


2. Caracterizar inequívocamente todas las combinaciones de dichos símbo- 
los que representan oraciones dotadas de sentido según la matemática clási- 
ca. Estas combinaciones se llaman “fórmulas”. (Adviértase que una oración 
dotada de sentido no tiene que ser verdadera. *1 + 1 = 1” es una oración 
dotada de sentido, pero falsa). 


a La última cita sigue inmediatamente al texto traducido en la nota 14. Justifica el uso 
común en la escuela de Hilbert del epíteto “intuicionista” para calificar los métodos de 
razonamiento “sustantivo” admitidos por ella. Herbrand (1931; EL, p. 225, n. 3) define 
dicho epíteto con admirable claridad: 


Entendemos por razonamiento intuicionista un razonamiento que satisfaga las si- 
guientes condiciones: en él se considera sólo un número finito determinado de 
objetos y de funciones; éstas están bien definidas, de modo que su definición 
permita calcular unívocamente su valor; nunca se afirma la existencia de un obje- 
to sin dar el medio de construirlo; nunca se considera el conjunto de todos los 
objetos x de una colección infinita; y cuando se dice que un razonamiento (o un 
teorema) es verdadero para todo x, esto significa que para cada x tomado particu- 
larmente se puede repetir el razonamiento general en cuestión, el cual no debe 
considerarse sino como el prototipo de estos razonamientos particulares. 
(Herbrand, EL, p. 225 n.3) 
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3. Determinar un procedimiento que permita construir sucesivamente todas 
las fórmulas que corresponden a oraciones “demostrables” de la matemática 
clásica. Tales construcciones se llaman “pruebas”. 


Como estas tres tareas ya fueron ejecutadas casi a cabalidad por Whitehead 
y Russell antes de que Hilbert siquiera concibiese su programa, sólo queda 
por resolver una cuarta y última tarea, que von Neumann describe aproxi- 
madamente en estos términos: 


4. Mostrar “de un modo combinatorio finitista” que las fórmulas corres- 
pondientes a oraciones de la matemática clásica que pueden verificarse por 
métodos aritméticos finitistas pueden “probarse” —esto es, construirse me- 
diante el procedimiento mencionado en el punto 3— sí y sólo si la verifica- 
ción de la oración correspondiente muestra que ésta es verdadera. 


Con el cumplimiento de esta tarea quedará establecida la consistencia de la 
matemática formalizada (puesto que si fuese inconsistente se podría “pro- 
bar” en ella la fórmula representativa de una igualdad numérica falsa). Pero 
se establecerá además que la fórmula representativa de cualquier verdad arit- 
mética elemental puede “probarse” en la matemática formalizada. En otras 
palabras, el programa de Hilbert, según lo explica von Neumann en 1930, 
proponía demostrar, no sólo que la matemática formalizada es consistente, 
sino además que constituye una representación formal completa de la arit- 
mética elemental.'* Esta doble demostración tiene que llevarse a cabo ente- 


16 Hilbert (1930, p. 6) menciona “la completud (Vollstindigkeit) del sistema de axiomas 
de la aritmética (Zahlentheorie) así como del análisis” entre los “problemas de funda- 
mentación de las matemáticas” aún pendientes. Aunque dicha completud “comúnmente 
se admite, la consideración usual mediante la cual se muestra que cualquier par de rea- 
lizaciones del sistema de axiomas de la aritmética (respectivamente, del análisis) tie- 
nen que ser isomórficas, no satisface las exigencias del rigor finito”. Hilbert propone 
dar en cambio —“por de pronto para la aritmética, cuyo campo se deja delimitar con 
precisión” — un sustituto finitista de la prueba habitual de isomorfismo, demostrando 
que “si es posible probar la consistencia de una oración S con los axiomas de la arit- 
mética, no es posible probar la consistencia de —S (la contradictoria de S) con esos 
axiomas”. Adviértase que el trabajo en que Hilbert propone este problema no fue in- 
cluido en sus Gesammelte Abhandlungen (editados después de la publicación de los 
teoremas de incompletud de Gódel). 
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ramente con los recursos del análisis combinatorio finito. Por una curiosa 
coincidencia, Gódel anunció en la misma reunión de Kónigsberg sus céle- 
bres teoremas de incompletud (Gódel 1930a, 1931). Los estudiaremos en el 
Capítulo 2.10. Por ahora, baste indicar, grosso modo, que en virtud de ellos, 
si T es una formalización de la aritmética elemental ajustada a las condicio- 
nes 1, 2 y 3 no es posible que Y sea a la vez consistente y completa. Ade- 
más, aunque en dicha formalización Y habrá más de una fórmula apta para 
representar la oración *Y es consistente”, ninguna de ellas se puede “probar” 
en Y a menos que Y sea inconsistente. Como los razonamientos del análisis 
combinatorio finito ciertamente se dejarían representar mediante “pruebas” 
en una tal formalización de la aritmética, sería imposible ejecutar la tarea 
cuarta y final del programa de Hilbert “de modo combinatorio finitista”. Pero 
Hilbert nunca había explicado con tanta precisión como von Neumann el 
significado de su “postura finita” y gracias a eso pudo eventualmente “am- 
pliar el marco metódico” de su programa a la luz de los hallazgos de Gódel, 
sin admitir su fracaso.!” 


Véase la Sección 2.9.4. También el Capitulo 2.12, primer párrafo y nota 1, donde me 
refiero a Hilbert y Bernays 1939, $ 5, “Der Anlaf zur Erweiterung des methodischen 
Rahmens der Beweistheorie” (““El motivo para ampliar el marco metódico de la Teoría 
de la Prueba”). El tomo I de la misma obra contiene la siguiente explicación, elocuente 
pero no muy precisa, sobre el significado del adjetivo “finit” (que generalmente traduz- 
co “finitista”): 


Con la palabra “finit” queremos siempre expresar que la reflexión, aseveración o 
definición así calificada se ciñe a los límites de la representabilidad de objetos y 
de la ejecutabilidad de procesos y por lo tanto se realiza en el marco de una con- 
sideración concreta. 

(Hilbert y Bernays 1934, p. 32) 


Donde escribo “representabilidad” y “ejecutabilidad”, los autores dicen “grundsátzliche 
Vorstellbarkeit” (“representabilidad en principio”) y “grundsátzliche Ausfiihrbarkeit” 
(“ejecutabilidad en principio”), pero me ha parecido inútil agregar una indicación que 
lastra la frase y que cualquier lector de inteligencia mediterránea sobreentiende. 


2.2 ESCRITURA CONCEPTUAL 


Leibniz soñó con “una lengua o escritura universal” en que “los caracteres y 
las palabras dirigirían la razón y los errores que no fuesen errores de hecho 
no serían sino errores de cálculo” (GP, III, 605). En dicho lenguaje artificial, 
toda falacia del razonamiento estaría vedada por la sintaxis, de modo que 


un sofisma, expresado en tal nueva forma de escritura, no sería en verdad 
más que un solecismo o barbarismo, fácil de refutar aduciendo las leyes 
de esa gramática filosófica. Así, cuando surgieran desacuerdos entre dos 
filósofos, no haría falta más discusión que entre un par de calculistas. 
Bastaría que, pluma en mano, —en presencia, si se quiere, de un ami- 
go— se sentasen a sus ábacos, diciéndose mutuamente: calculemos. 
(Leibniz, GP, VII, 200)! 


Para lograr este resultado, Leibniz propuso extender a la lógica los méto- 
dos algebraicos utilizados con tanto éxito en aritmética y geometría. Entre 
sus papeles quedaron —inéditos hasta el siglo XIX— algunos ensayos rudi- 
mentarios de lógica algebraica. Pero la idea de un álgebra de la lógica sólo 
toma vuelo con los libros de Boole (1847, 1854).? La tradición booleana, 
cultivada en Inglaterra por Jevons y en América por Peirce, fue recogida y 
promovida en Alemania por Ernst Schróder (1877, VAL: 1890-1905). Para 
el filósofo norteamericano C. I. Lewis —que publica un Panorama de la 
lógica simbólica en 1918— “el álgebra clásica de la lógica” lleva los apelli- 
dos de Boole y Schróder. En cambio, Hilbert, que sin duda los conocía, no 
suele nombrarlos entre los precursores de su programa, cuya iniciación atri- 


Véase asímismo Leibniz, GP, VIL, 204-207 (traducción castellana en Leibniz, EF, pp. 
188-193). 

Los aportes más interesantes de Leibniz son quizás los dos “especímenes” en GP, VIL 
228-247 (traducción inglesa en Leibniz, LP, pp. 122-144). En el siglo XVII hubo 
algunos intentos aislados por desarrollar un cálculo lógico; al respecto, véase C. IL. Lewis 
1918, pp. 18-51, quien destaca sobre todo la obra de J. H. Lambert. 
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buye, como hemos visto, a Gottlob Frege —a quien Lewis dedica menos de 
una página de su Panorama (1918, pp. 114s.)— y a sus continuadores Russell 
y Whitehead. 

Varias razones justifican, a mi modo de ver, esta preferencia de Hilbert 
por Frege. En primer lugar, Frege creó su propia lengua artificial (Escritura 
conceptual, 1879) con el propósito específico de expresar en ella razonamien- 
tos matemáticos y utilizarla en la fundamentación estrictamente lógica de la 
aritmética. En cierto modo, pues, el proyecto de Frege anticipa directamente 
el programa de Hilbert. Además —como reconoce el propio Lewis— Frege 
entendió antes que nadie los requisitos que ha de cumplir la representación 
escrita de un razonamiento deductivo para que la corrección o incorrección 
del mismo pueda controlarse mediante un cálculo. Pero, sobre todo, debe- 
mos a Frege el análisis moderno de los predicados relacionales y la genera- 
lización universal, que hizo posible entender muchas demonstraciones mate- 
máticas como casos de simple inferencia lógica.? 

Frege abraza sin reservas la clasificación kantiana de las verdades en 
analíticas y sintéticas. Mejorando a Kant, caracteriza ambas clases de modo 
que constituyan una genuina partición: verdades analíticas son las que se de- 
ducen de leyes lógicas y meras definiciones; cualquier verdad que no es ana- 
lítica es sintética.* La meta de sus investigaciones lógico-matemáticas es de- 
mostrar que las verdades de la aritmética y del análisis son, en este sentido, 


Conviene, sí, recordar que también Peirce (1870, 1880, 1882, 1883) desarrolló por esos 
mismos años —independientemente de Frege— la lógica moderna de la generalización 
y de los predicados poliádicos. Por otra parte, como ha mostrado Goldfarb (1979), la 
generalización vino a entenderse cabalmente como la entendemos ahora sólo después 
de 1920, precisamente en la escuela de Hilbert. 


Para Kant una aseveración es analítica si el predicado está contenido en el concepto 
del sujeto y es sintética si el predicado no está contenido en el concepto del sujeto. Las 
aseveraciones disyuntivas y condicionales, que no se dejan analizar en sujeto y predi- 
cado, no caen, pues, en ninguna de estas dos clases, según Kant. Frege tuvo que pro- 
poner una caracterización diferente porque en un comienzo rechazó el análisis tradicio- 
nal de las aseveraciones en sujeto y predicado (Frege 1879, p. 3). Su caracterización 
aventaja también a la kantiana en cuanto permite clasificar sin dificultada como analí- 
ticas a las aseveraciones que expresan leyes lógicas. En efecto, como indiqué en el 
Capitulo 2.1, decimos que una aseveración a. se deduce de un conjunto de asevera- 
ciones % si a. ocupa el último lugar en una lista de aseveraciones cada una de las cuales 
pertenece a F o se infiere directamente de una o más de sus predecesoras en la lista. 
Por lo tanto, si F es un conjunto de aseveraciones que expresan leyes lógicas y aL es 
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analíticas. Para presentar la demostración de tal modo que no dejase lugar a 
dudas, Frege inventó su “Begriffschrift” (“escritura conceptual”), un lengua- 
je artificial especialmente diseñado para la formulación perspicua de infe- 
rencias deductivas, que designaré aquí con la sigla BS. BS es una versión de 
lo que hoy llamamos un cálculo predicativo. Frege admite la posibilidad de 
hacer generalizaciones referentes a propiedades y relaciones, pero no la re- 
glamenta expresamente. Si BS* es lo que resta de BS cuando se elimina esta 
posibilidad y sólo se permiten generalizaciones referentes a objetos indivi- 
duales, tenemos que BS* equivale a nuestro cálculo predicativo de primer 
orden.* 

Aunque Frege maneja el lenguaje BS con impecable coherencia, sus expli- 
caciones gramaticales no siempre alcanzan la claridad y precisión a que nos 
han habituado sus seguidores, los modernos tratadistas de lógica. No llega a 
dar un inventario formal de las letras que pueden usarse como variables y 
constantes de BS, ni una codificación exhaustiva del modo de utilizarlas.? 
Además, en su presentación original, la elucidación de las nociones decisi- 
vas de “contenido” y de “función” deja mucho que desear. Frege corrige este 
defecto en la presentación final de BS en el tomo I de Leyes fundamentales 
de la aritmética (1893), aprovechando las grandes innovaciones ontológicas 
y semánticas introducidas en “Función y concepto” (1891), “Sobre sentido 
y denotación” (1892) y “Sobre concepto y objeto” (1892a). No puedo entrar 


una de ellas, diremos que a: se deduce de , por cuanto a. ocupa ciertamente el último 
lugar de la lista cuyo único miembro es a. y, por hipótesis, a. e Y. 

Antes de leer el resto de este capítulo —y los siguientes— el lector que no haya estu- 
diado algo de lógica moderna debiera darle una ojeada al Apéndice IX sobre el cálculo 
predicativo. Como la exposición es bastante concisa, no creo que le aproveche a quien 
no tenga ya cierta práctica en la lectura de obras matemáticas. El lector que no la ten- 
ga debe leer uno o dos manuales de lógica. Recomiendo a Jeffrey 1981 y Mates 1970, 
cuyas virtudes se complementan. 


Ello genera sorpresas. Así, a la luz de los ejemplos de Frege 1879, p. 51, y de una 
lectura desaprensiva de los $$ 9-12, el lector pensará ingenuamente que, en la expre- 
siones f(b), g(b), h(b) de la Proposición 60 (p. 52), la letra b es una constante o varia- 
ble individual, y las letras f£ g y h son predicados. Pero en la p. 69 se nos manda 
sustituir, en la Proposición 60, la letra b por la variable predicativa ¿5 y las expresiones 
de la forma f(T”) por expresiones de la forma I(y), de modo que Ab) ha de reemplazar- 
se con 30). 
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aquí a comentar esas innovaciones,” aunque daré al respecto una indicación 
somera que ayude a entender la gramática de BS. 

Los signos de BS son de dos clases: letras, “con las que uno puede 
representarse una variedad de cosas”, y figuras lineales “que tienen un sen- 
tido completamente determinado”. Las letras, de varios tipos, “deben servir 
principalemente para expresar la generalidad” (1879, p. 1). Como dije, Frege 
no explica metódicamente cómo se usan los distintos tipos de letras. Sólo el 
empleo de las letras góticas a, Y, ... está cuidadosamente reglamentado: 
una letra gótica sólo puede figurar en una expresión si va precedida de un 
cuantificador que la contiene; en otras palabras, en BS una letra gótica es 
siempre una variable ligada (individual, si es minúscula; predicativa, si es 
mayúscula). Entiendo, en cambio, que las mayúsculas del alfabeto griego, 
A, B, T,... funcionan como constantes, que algunas veces significan una 
oración completa (así, la A y la B en Frege 1879, p. 22), otras veces un 
predicado determinado (vgr. la D en esa página).? Las minúsculas del alfa- 
beto griego, a, P, y, ... se usan en Escritura conceptual como índices — 
esto es, variables ligadas— en ciertas expresiones simbólicas definidas (1879, 
$$ 24, 26) que se dejan eliminar; también figuran en las indicaciones margi- 
nales sobre sustitución de expresiones, pero en este uso no pertenecen a BS, 
sino a la lengua viva —el alemán— en que se dan esas indicaciones: son 
pues lo que hoy llamamos “variables metalingiísticas?. En Leyes fundamen- 
tales de la aritmética las minúsculas griegas tienen también otros usos que 
no es preciso detallar aquí. Por último, las cursivas latinas minúsculas se 
emplean como variables libres: a, b, c, m y x funcionan a veces como varia- 
bles proposicionales (Proposiciones 1-51), a veces como variables in- 
dividuales (Proposiciones 52-62, 64-65), a veces como ambas cosas (Pro- 
posiciones 63, 67 y 68); en cambio, f, g, h y la mayúscula F son variables 


Los tres artículos mencionados están bien traducidos al castellano en Frege, LS. 


Frege dice que esta clasificación de los signos y sus funciones se inspira en el ejemplo 
de la matemática que usa letras a, b, x, y,... con significado variable e ideogramas 
como +, X, Y con un significado fijo. Pero los matemáticos, según él, no son entera- 
mente consecuentes, puesto que usan combinaciones de letras, como log, sen, Lim, como 
ideogramas (1879, p. 1 n.). 

Frege 1879, p. 2n., dice que las mayúsculas griegas son “abreviaturas” a las que el 
lector ha de asignar cualquier sentido apropiado, cuando no estén expresamente defini- 
das por el autor. 
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predicativas (monádicas o diádicas). 
Las figuras lineales en BS se componen de los signos siguientes: 1, — , 


— EL , wr y =. Como luego veremos, = (en 1879, =) es el signo de 


identidad; 7 es el signo de cuantificación universal (la variable ligada anida 


en la cucharita), y — y 1 corresponden respectivamente a nuestros signos 


de negación (+=) e implicación (>). Pero los signos 1 y — no tienen su 
homólogo en el cálculo predicativo actual. Frege los explica así: 


Una aseveración (Urtheil) se expresará siempre mediante el signo 
ke 


situado a la izquierda del signo o combinación de signos que indica el 
contenido de la aseveración. Al omitir el breve trazo vertical en el ex- 
tremo izquierdo del horizontal, la aseveración se convierte en una mera 
combinación de representaciones (blosse Vorstellungsverbindung), de la 
cual el escribiente no expresa si le atribuye verdad o no. Por ejemplo, si 


AN 


significa la aseveración “los polos magnéticos de distinto nombre se 
atraen”, entonces 


—A 


no expresa la aseveración, sino debe evocar en el lector únicamente la 
representación de la atracción mutua de los polos magnéticos de distinto 
nombre, tal vez para derivar de ella consecuencias y examinar a la luz de 
éstas si el pensamiento (Gedanke) es correcto. En este caso, parafraseamos 
la expresión con las palabras “la circunstancia de que” o “la proposición.” 
G,der Satz, daf3%). [...] El trazo horizontal con que se forma el signo 
k— reúne los signos siguientes en un todo, y a este todo se refiere la 
afirmación expresada por el trazo vertical en el extremo izquierdo del 
horizontal. 


(Frege 1879, pp. 1-2)" 


Nótese que Frege identifica aquí la representación evocada por los signos —que puede 
variar mucho de lector en lector— con el pensamiento expresado mediante ellos —que 
ha ser el mismo para todos si la escritura sirve como medio de comunicación—; más 
tarde distinguirá enfáticamente estas dos cosas. Más grave me parece la confusión si- 
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Frege recuerda enseguida que no todo contenido expresable verbalmente 
puede ser materia de una aseveración. Puedo aseverar: “la casa de Juan es 
de madera”; pero no puedo aseverar: “casa”. Cabe, pues, distinguir entre con- 
tenidos aseverables y no aseverables (“beurtheilbare und unbeurtheilbare 
Inhalte”). Llamemos simple a una aseveración cuyo contenido aseverable no 
incluye partes (distintas de él) que a su vez son contenidos aseverables. La 
lógica tradicional analizaba el contenido aseverable de cualquier aseveración 
simple en dos componentes no aseverables: sujeto y predicado. Frege recha- 
za este análisis (1879, p. 2). Hace ver, en cambio, que un mismo contenido, 
aseverable o no, puede analizarse de diversas maneras, fijando una parte de 
la expresión que lo enuncia y tratando el resto como variable. Así, en la 
expresión “Juan admira a Juanita”, si fijo “admira a Juanita' y reemplazo “Juan” 
por “Pedro”, “Diego”, etc. efectúo un análisis similar al tradicional; si fijo 
“Juan admira a* y reemplazo “Juanita” por “Isabel”, “Beatriz”, etc., llego a un 
análisis correspondiente al tradicional de “Juanita es admirada por Juan”, que 
es el mismo contenido aseverable, expresado en voz pasiva; pero si sólo fijo 
“admira a? y reemplazo el par (“Juan”, *Juanita”) por (“Pedro”, “Isabel”)», 
(Diego”, “Beatriz”), (“Diego”, “Juanita”), etc., o si fijo (“Juan”, “Juanita”) y 
reemplazo “admira a” por “saluda a”, “sonríe a”, “detesta a”, etc. obtengo 
descomposiciones del contenido aseverable que no tienen precedente en la 
lógica tradicional. Los contenidos no aseverables admiten el mismo trata- 
miento: por ejemplo, en la frase “la casa de Juan”, puedo fijar “la casa” y 
reemplazar “de Juan” por “de Diego”, “de Pedro”, etc. o fijar “de Juan” y re- 
emplazar “la casa” por “la mujer”, “la profesión”, “el país”, etc., o fijar *de” y 
tratar el par (la casa”, Juan”) como variable.!! En Escritura conceptual, Frege 


guiente: Frege sugiere que uno puede derivar consecuencias de un pensamiento no 
aseverado (y examinar la corrección de éste a la luz de aquéllas), pero según las reglas 
de inferencia de BS, las premisas de una deducción tienen que ser aseveraciones (esto 
es, expresiones de la forma H-A, nunca de la forma —A). 


La simetría que Frege evidentemente postula entre estos diversos modos de análisis 
hace comprensibles las sustituciones descritas en la nota 6. La libertad con que Frege 
está dispuesto a ver en una expresión como “León ríe”, tanto una expresión del valor 
de la función ríe para el argumento León (reemplazable por Pedro, Juan, Diego, etc.) 
como una expresión del valor de la función León para el argumento ríe (reemplazable 
por “llora”, “ruge”, “muerde”, etc.) es familiar en matemáticas. He aquí un caso análo- 
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— inspirándose en la terminología matemática— llama función al componente 
fijo, argumento al componente reputado variable de una expresión represen- 
tativa de un dado contenido, aseverable o no.!? Pero en Leyes fundamentales 
de la aritmética rechaza sin más el error de quienes consideran a la función 
“como una expresión, una combinación de signos, y no como lo designado 
por ellos” (1893, p. 5). 

Hacia 1891 Frege llegó a la conclusión de que en el significado de las 
expresiones lingiísticas hay que distinguir dos aspectos complementarios pero 
bien diferentes: su sentido (Sinn) y lo que llamaré su denotación (Frege lo 
llama Bedeutung; literalmente, *significado”).!* Las expresiones *7?”, *100 — 
51” y d11 x 2) + (9 x 3)' denotan lo mismo, a saber, el número 49, pero no 
lo presentan del mismo modo, así que no tienen el mismo sentido. Una igual- 
dad, como 13? = 371.293, sería falsa si el miembro de la izquierda no deno- 
tase el mismo objeto que el miembro de la derecha, pero sería banal si ambos 
miembros tuviesen el mismo sentido, como en 13% = 13%. Por ese mismo 
tiempo, Frege (1891, 1892a) revisa a fondo su distingo entre función y argu- 
mento. Observa que hay dos clases de expresiones: expresiones “saturadas” 
(gesáttigt), cuyo sentido está completo o “cerrado” (abgeschlossen), y ex- 


go, tomado del álgebra lineal: Si Y es un espacio vectorial sobre el cuerpo R, las apli- 
caciones lineales de Y en RR forman otro espacio vectorial V* sobre [R. Las aplicacio- 
nes lineales de V* en R se identifican con los vectores de Y mediante la estipulación 
siguiente: para cada r e V, r: V* => Res la aplicación (demostrablemente lineal) que 
en cada € e V* toma precisamente el valor que €: Y —= R toma en r. Se acostumbra 
designar dicho valor con (¿lr), una expresión que puede leerse de dos maneras, a saber 
(1) “el valor E(r) de la función lineal E: V —= R en el argumento r e V” y (ii) “el valor 
r(£) de la función lineal r: V* = RR en el argumento E e V*”. 
12 Cito la definición pertinente: 
Si en una expresión (Ausdruck) —cuyo contenido no tiene que ser aseverable— 
figura en una o más posiciones un signo (Zeichen) simple o compuesto y pensa- 
mos que este signo es reemplazable en algunas de esas posiciones o en todas ellas 
por otra cosa (durch Anderes), pero que sea la misma en cada caso, llamamos 
función a la parte de la expresión que se presenta en este respecto como invaria- 
ble y a la parte reemplazable la llamamos su argumento. 
(Frege 1879, p. 18; énfasis mío; el pasaje entero va en cursiva en el original) 


13 El distingo entre Sinn y Bedeutung es el tema de Frege 1892, pero ya aparece mencio- 


nado en Frege 1891, p. 14. 
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presiones “insaturadas” (ungesáttigt), que entendemos como provistas de uno 
o más blancos a llenar con expresiones saturadas. En los ejemplos del párra- 
fo anterior, “Juan”, “la casa de Juan”, “Juan admira a Juanita? son expresio- 
nes saturadas; en cambio, “la casa de ...”, *... de ...”, *... admira a Juanita”, 
“Juan admira a ...”, *... admira a ...' son expresiones insaturadas (en las que 
ahora he marcado blancos donde antes los subentendíamos). Según Frege, la 
diferencia entre expresiones saturadas e insaturadas refleja la división de lo 
real en dos categorías irreductibles: objetos (Gegenstáinde) y funciones 
(Funktionen). Aquéllos son, en cierto modo, completos y se los denota con 
expresiones saturadas; éstas son incompletas y se las designa mediante ex- 
presiones insaturadas. Por ejemplo, *3” y “7” denotan objetos; *... +...* de- 
signa una función. La expresión saturada “3 + 7” denota el objeto que es el 
valor de la función ...+... en el par de argumentos (3,7); el mismo objeto es 
denotado también por la expresión saturada “10”. 

A la luz de estas ideas nuevas, es claro que lo que Frege llamaba en 1879 
“contenido aseverable” reúne —y confunde— el sentido y la denotación de 
la expresión utilizada para hacer una aseveración (1893, p. 9 n. 2). Toda 
expresión utilizable para ello, es decir, toda oración declarativa, es por cier- 
to una expresión saturada. Su sentido es lo que Frege llama un pensamiento 
(Gedanke); su denotación, uno de los dos objetos que llama valores veritativos 
(Wahrheitswerte): lo verdadero (das Wahre) o lo falso. Una oración declarativa 
simple —no formada por combinación o transformación de otras oraciones 
declarativas— constará en todo caso de una o más expresiones saturadas que 
denotan objetos, insertadas en los huecos de una expresión insaturada que 
denota un concepto. Un concepto es pues una función que admite como ar- 
gumento cualquier n-tuplo de objetos (para un entero positivo fijo n, carac- 
terístico de ese concepto), pero cuyo valor para un dado argumento sólo puede 
ser uno de los dos valores veritativos, a saber, lo verdadero, si el n-tuplo en 
cuestión cae bajo el concepto, y lo falso, si dicho n-tuplo no cae bajo el 
concepto. 

El distingo entre objetos “llenos” y funciones “huecas” evoca la clásica 
división de lo real en particulares y universales, combinada con la tesis 
occamista de que sólo los particulares existen plenamente, mientras que los 
universales sólo pueden actualizarse en aquellos. El distingo entre dos clases 
de expresiones correspondientes a las dos categorías de entes da nueva vida 
al análisis de las oraciones en sujeto y predicado, rechazado por Frege en 
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1879. Pero este análisis rebasa ahora los estrechos límites a que lo confina- 
ba la tradición. Según ella, cada aseveración simple se refería a un solo objeto, 
el sujeto, denotado por una expresión saturada, y le atribuía una propiedad, 
designada con una expresión insaturada, el predicado. En cambio, como Frege 
entiende que las expresiones insaturadas denotan funciones —en una acep- 
ción del vocablo inspirada en la terminología matemática—, puede con toda 
naturalidad admitir que una aseveración simple se refiera a un n-tuplo de 
objetos (n = 1, 2,...) y les atribuya una relación (si n > 1). Por otra parte, 
a la luz del análisis fregeano, es claro que un predicado (expresión insaturada) 
no puede hacer las veces de sujeto (expresión saturada). Así, si *Hp” signifi- 
ca “Píndaro es hombre” y “Gp” significa “Píndaro es griego”, no es lícito poner 
en la primera oración *G” en el lugar de “p” para significar (1) “Todo griego 
es hombre” o (11) “Algún griego es hombre”. En estas oraciones del lenguaje 
corriente, el sujeto gramatical — “todo griego”, “algún griego”— no denota 
un objeto al cual se atribuye el predicado sino que circunscribe la clase a 
que ese objeto pertenece (mediante un predicado común a todos los miem- 
bros de esa clase). Así, según Frege, lo que dicen las oraciones citadas que- 
da mejor expresado por (1) “Si algo es griego, también es hombre” y (11) “Hay 
algo que es griego y también hombre” (en el simbolismo estándar del cálcu- 
lo predicativo: (1) Vx(Gx > Hx); (11) Ix(Gx A Hx)). Gracias a estas innova- 
ciones, Frege pudo poner de manifiesto, como dije, la índole puramente ló- 
gica de muchas demostraciones matemáticas.!* 

Ahora puedo dar con Frege una definición más clara y satisfactoria de la 
línea — y de los cuatro signos de BS que arriba dejamos sin definir (cf. 
Frege 1893, pp. 9-12). Usaré la letra negrita v para nombrar lo verdadero y 
la f para nombrar lo falso. La línea — designa la función cuyo valor es v en 
el argumento v y cuyo valor es f en cualquier otro argumento.!* El signo — 


Por ejemplo, de las premisas “4/2 es la raíz cuadrada positiva de dos” (que representaré 
con “Rard a r > 0”), “Cuatro es el cuadrado de dos” (*Qcd”) y “Toda raíz cuadrada de 
un número es una raíz cuarta del cuadrado de ese número” (“VWxWy(Oyx > Vz(Rzax > 
Razy))”) se deduce fácilmente que “x/2 es una raíz cuarta de cuatro” (R¿rc”), una con- 
clusión obvia que sin embargo es inaccesible a la lógica aristotélica. 


Así pues, la función —, restringida a valores veritativos, es precisamente la aplicación 
xex(—IT=vsiT = v y —T =fsi T' =f), lo cual explica que no haya una signo 
para ella en el simbolismo lógico actual: normalmente sería superfluo. Pero Frege no 
deslinda explícitamente el dominio de sus funciones, a las que trata como si cada una 
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designa la función cuyo valor es f en cada argumento x tal que —x es v y 
cuyo valor es y en cada argumento x tal que —x es f (nuestro signo de 
negación — se inspira probablemente en este signo fregeano).!? La expresión 
“huy f(1)” denota v si y sólo si la función f( ) toma el valor v en todo argu- 
mento. La expresión *3- H(A)” denota v si y sólo toda función toma el valor 
v en el argumento fijo A. Vemos así que, como arriba adelanté, el signo — 
funciona como signo de cuantificación universal, correspondiente a nuestro 
V, y liga la variable individual o predicativa inscrita en él. La expresión “a 
= b” denota v si “a” y “b” denotan el mismo objeto y denota f si “a? y *b” no 
denotan el mismo objeto. Así, si “a? y “b” son términos, “a = b” dice que a 
es idéntico a b y si “a? y *b* son aseveraciones, ía = b* dice que a si y sólo 


A 
si b. Por último, el signo T designa la función binaria definida así: (1) Es 
es f si y sólo si B es v y A es un objeto distinto de v; (ii) si A es Y o si B 


no es v, —A es v (Frege 1891, p. 28; 1893, p. 20).!” 
B 


de ellas estuviera definida en todo el universo de objetos. Esto es una ilusión, pues si 
“W” designa el universo de objetos, una función irrestricta binaria (una “función de dos 
variables”) no está definida en W sino en W2, una función ternaria en W?, etc. 


Esta función, como todas las de Frege, está definida para cada objeto (nota 15). Según 
esto, —x es v aunque “x” no denote un valor veritativo. 

Frege 1879, p. 5, dice que “si A y B significan contenidos aseverables, hay las cuatro 
posibilidades siguientes: (1) se afirma A y se afirma B; (2) se afirma A y se niega B; 


(3) se niega A y se afirma B; (4) se niega A y se niega B. "E Asignifica entonces la 
B 


aseveración de que la tercera de estas posibilidades no se cumple, sino una de las 
otras tres.” A la luz de esta caracterización, Baker y Hacker (1984), concluyen que en 
1879 Frege no había dado aún con la definición verifuncional de la implicación, des- 
cubierta por Filón de Megara en el siglo II a.C. El texto citado respalda este diag- 


nóstico sólo si se toma al pie de la letra, esto es, si se entiende que TT A es una 
B 


aseveración biográfica relativa a lo que alguna persona indeterminada de hecho aseve- 
ra o no asevera. Pero no creo que fuera la intención de Frege entenderlo así. En las pp. 
10-11 del mismo libro trata como equivalentes las expresiones “se afirma B” (*B wird 
bejaht”) y “'B ha de afirmarse” ('B zu bejahen ... ist”), y creo que ya en 1879 Frege 
pensaba que un contenido aseverable ha de afirmarse si y sólo si es verdadero. 
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La última definición indica sin lugar a dudas que ES representa la 
B 


implicación material que hoy representamos con (A > B). Frege advierte 


oportunamente al lector que $ A corresponde a “si B, entonces A” (“wenn 
B 
A, so B”) sólo parcialmente, en algunos casos.!$ Hay, en cambio, funciones 


compuestas de — y T que corresponden a ciertas conjunciones familiares. 
Así, " corresponde exactamente a la conjunción “y”, pues, como el lec- 


tor puede fácilmente calcular, PRE A denota v si —A y —B denotan v, y 
B 


de otro modo denota f. Y E corresponde a la conjunción “o” entendida 


en un sentido no excluyente, puesto que A denota f si —A y —B 
B 


denotan f, y de otro modo denota v. En otras palabras, =r es la función 


que simbolizamos 1” y E es la función que simbolizamos *v”. Aprove- 


chando la correspondencia entre la función A y la conjunción *y”, los profe- 
sores de lógica suelen introducir primero esa función en sus explicaciones y 
luego definen —> como una función compuesta de A y —. Frege no obró así 
porque, mucho más que traducir la escritura conceptual BS al lenguaje coti- 
diano, le interesaba escribir deducciones de manera perspicua y —> se presta 
muchísimo mejor que » para este propósito. 

En efecto, con los signos de BS y las convenciones semánticas de Frege, 


la regla modus ponens (MP) puede enunciarse así: De las premisas Ara y 
B 


K— B, deducir la conclusión H— A. O, más gráficamente: 


Su buen sentido contrasta con la irreflexión de esos profesores de lógica que enseñan que 
(A > B) se lee “si A, entonces B” y tienen luego que enfrentar la mirada escéptica de sus 
alumnos cuando, a resultas de ello, se ven forzados a sostener que un enunciado como “si 
la luna está hecha de queso, entonces 2 + 2 = 4” expresa una verdad necesaria. 
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Ts 
KB 


A 


Presentada así, no cabe la menor duda de que la deducción es correcta, cuales- 
quiera que sean las oraciones declarativas A y B, puesto que, si la segunda 
premisa es verdadera, la primera premisa sólo puede ser verdadera si la con- 
clusión también lo es. Para controlar la corrección de una inferencia en que 
se usa esta regla basta comprobar por simple inspección visual que la expre- 
sión a la derecha del signo H— en la conclusión es igual a la expresión a la 


derecha de la línea horizontal superior del signo EN en la primera premisa 


y que la expresión a la derecha de la línea horizontal inferior de este último 
signo es igual a la expresión a la derecha del signo H— en la segunda premi- 
sa. 
En el $ 11 de Escritura conceptual Frege enuncia la regla de inferencia 
que hoy suele llamarse generalización universal (GU): Deducir de la premi- 
D(a) la conclusión 2 D(a) siempre que Á sea una expresión en la 
sal ) A ha ) siempre q p 


cual no figura a y que a sólo figure en Día) en las posiciones que ocupa A 

en D(a). Frege justifica esta regla así: “Si =a— D(a) es negado se tiene que 

poder asignar a a un significado tal que P(a) sea negado. Por lo tanto, si 

=4— O(a) fuera negado y A fuera afirmado, se tendría que poder asignar a 

a un significado tal que A fuese afirmado y P(a) fuese negado. Pero ello es 

imposible en virtud de is ya que esto significa que está excluido el 
A 


caso en que DP(a) es negado y A es afirmado. Por lo tanto, no es posible 


negar =a— O(a) y afirmar A; esto es: pe Dd(a)” (Frege 1879, pp. 21s.) 
A 


Sin embargo, en las deducciones de ese libro, Frege no utiliza —por lo 
que veo— esta regla GU, sino únicamente la regla MP y una regla de sus- 
titución, cuyos requisitos no llega a formular expresamente. Conforme a esta 
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última, de una dada aseveración ss se infiere la aseveración 4' obtenida al 
sustituir uniformemente una determinada expresión KB que figura una o más 
veces en Y por otra expresión €. (Digo que € sustituye uniformemente a R 
en Í si se escribe “€ en lugar de % en todas las posiciones que % ocupa en 
A). Evidentemente, la aplicación de este procedimiento se puede controlar 
por simple inspección visual. Su justificación es también muy obvia cuando 
se manda reemplazar —como en las primeras deducciones del libro (Frege 
1879, $8 15-19)— una cursiva minúscula utilizada como variable proposi- 
cional en cierta aseveración sd por una oración (esto es, una expresión apta 
para denotar cualquiera de los valores veritativos v y f): bajo las reglas 
semánticas de BS, tal sustitución no puede afectar el valor veritativo deno- 
tado por 4. Pero no todas las sustituciones prescritas en esa obra siguen este 
sencillo patrón.'” En 1893, Frege describe y justifica en detalle los pro- 
cedimientos de sustitución admisibles y enuncia además otras reglas que 
validan pasos que en 1879 presentaba como sustituciones. El “Resumen de 
reglas” en Frege 1893, $ 48, enumera doce (más seis “estipulaciones sobre 
el uso de paréntesis”). La regla MP es sólo una de ellas. No puedo examinar 
aquí las otras. Baste señalar que —como vimos en el caso de MP— aunque 
la justificación de cada regla es semántica, su aplicación y el control de su 
aplicación depende exclusivamente de la apariencia visual de las expresio- 
nes envueltas, y no de su significado. Esto es esencial para el propósito de 
BS, que es poner de manifiesto, sin lugar a dudas, los nexos deductivos entre 
las verdades aritméticas y las leyes lógicas suplementadas con definiciones. 

Una expresión 4 del BS representa una ley lógica si denota la verdad en 
todo caso, sea cual sea la denotación de sus partes. En la segunda parte de 
Escritura conceptual, Frege enuncia nueve expresiones que cumplen este 
requisito, según hace evidente mediante consideraciones semánticas.? Estas 
expresiones son las premisas indemostradas de que parten sus deducciones. 
Constituyen, pues, una lista de axiomas para la lógica. Las reproduzco en el 


En la nota 6 mencioné las sustituciones que Frege aventura para probar la Proposición 
90. Hay otros ejemplos. 


Se Por ejemplo, el axioma 1 excluye el caso en que p es f, q es v y p es v, el cual es 


evidentemente imposible, puesto que p no puede ser v y fa la vez (Frege 1879, $ 14). 
Por cierto, esto no es una demostración del axioma; pero al aclarar lo que éste signi- 
fica se pone de manifiesto que no es posible negarlo. 


2.2 Escritura conceptual 142 


Apéndice X. Con el simbolismo del cálculo predicativo se las puede formu- 
lar como sigue:?! 


l. (p > (q > p)) 
2. (»> (q >) > (p > q) > (p > 1) 
8. (=> (y =D): => =>) 

28. (p > q) > Eq > =p)) 

31. (=p > p) 

41. (p > p) 

52. ((c = d) > (O(c) > D(d))) 

54 (c = Cc) 

S8. (VxD() > D(a)) 


La fuerza de estos axiomas depende, por cierto, de las reglas de inferencia 
que se adopten. Si las letras p, q y r se tratan como variables proposicionales, 
libremente sustituibles por oraciones, los Axiomas 1, 2, 8, 28, 31 y 41, 
combinados con la regla MP, bastan para deducir todas las oraciones com- 
puestas que denotan la verdad cualquiera que sea el valor veritativo de las 
oraciones componentes (esto es, todas las tautologías, en el sentido del Apén- 
dice IX.C). Supongamos, además, que en el Axioma 58 se permite la susti- 
tución de a por cualquier expresión t que designe un objeto y de P( ) por 
una expresión insaturada que se convierte en una oración en cuanto sus “blan- 
cos” se llenen todos con t. Entonces, como demostrará Gódel (1930), los 
Axiomas 1, 2, 8, 28, 31, 41 y 58, combinados con las reglas MP y GU bas- 


tan para deducir todas las verdades lógicas expresables en un cálculo predi- 


2 Doy a cada axioma el número que tiene en el libro de Frege (los números intermedios 


corresponden a teoremas deducidos de los axiomas precedentes). La “traducción” ofre- 
cida demanda algunos comentarios. Debemos recordar que en BS, el signo '=” (*=" en 
1879) funciona como nuestro símbolo de identidad “=” si las expresiones a la izquierda 
y la derecha son variables individuales o nombres de objetos, y como nuestro símbolo 
de equivalencia “4” si dichas expresiones son oraciones. Frege permite sustituir las 
letras c y d que figuran en los Axiomas 52 y 54 tanto por nombres como por oracio- 
nes. Por último, como señalé en la nota 6, en 1879 Frege se permite reemplazar la 
variable ligada en el Axioma 58 no sólo por nombres, sino también por predicados. 
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cativo de primer orden sin identidad (como el presentado en el Apéndice 
IX.A, B). Para deducir todas las verdades lógicas expresables en el cálculo 
predicativo de primer orden con identidad hay que agregar los Axiomas 52 
y 54 —en el entendido de que D(d) en el 52 se obtiene por sustitución uni- 
forme o parcial de c por d en D(c)— y autorizar la libre sustitución de las 
letras c y d que figuran en ellos por expresiones que designen objetos. Pero, 
como pondrá en claro el mismo Gódel (1930a, 1931), este sistema de axio- 
mas y reglas de inferencia, suplementado con todas las definiciones que se 
deseen, no es suficiente para deducir todas las verdades aritméticas. Distinto 
es el caso si adoptamos MP y la loca regla de sustitución empleada por Frege 
en 1879, o los axiomas y reglas de inferencia postulados por Frege en 1893. 
Tales recursos sí que bastan para deducir las verdades aritméticas y —en 
general — todo lo que uno quiera, pues, como Russell le informó a Frege el 
16 de junio de 1902, el sistema es inconsistente. 


En una carta dirigida a Frege en esa fecha, Russell vincula directamente la paradoja 
que hoy se conoce por su nombre a la liberalidad con que Frege admite y maneja las 
variables predicativas en Escritura conceptual. Esa liberalidad se manifiesta 
específicamente en la práctica fregeana —a que aludí en la nota 6— de sustituir por un 
predicado la variable c que figura en la línea superior del Axioma 58, . Sea w el pre- 
dicado “*...es un predicado no predicable de sí mismo”. Russell se pregunta si w es 
predicable de sí mismo. Como quiera que se conteste esta pregunta, se obtiene una 
contradicción. Por lo tanto, concluye Russell, w no es un predicado. Pero la contradic- 
ción es inevitable bajo las reglas (o prácticas) de Escritura conceptual. En efecto, en el 
BS de 1879, la condición con que Russell caracteriza el predicado w tendría que escri- 
birse así: HÁÍ— (— w(B)) = (— KGB)). Si en el Axioma 58 sustituimos, a la ma- 
nera de Frege, (1) por (—-wW(D)) = (—T(D))), a por Y y c por w, y aplicamos MP 
al par de premisas que forman el resultado de esta sustitución y la condición antedicha 
obtenemos inmediatamente la contradicción 


E(— w(0v)) = (5 w(w))) 


Russell agrega: “Asímismo, no hay ninguna clase (como un todo) de aquellas clases 
que —como todos— no se pertenecen a sí mismas. De ello concluyo que bajo ciertas 
circunstancias un conjunto definible no forma un todo (eine definierbare Menge kein 
Ganzes bildet).” (Frege, WB, p. 211). La paradoja de Russell surge, por cierto, tam- 
bién en el sistema más riguroso de Frege 1893/1903 (véase el Apéndice XID. 


2.3 FUNDAMENTOS DE LA ARITMÉTICA 


El aporte más importante de Frege a la filosofía matemática consiste en lo 
que ya hemos visto: su concepción de la escritura conceptual y su análisis 
de las relaciones y de las aseveraciones condicionales y universales (Capitu- 
lo 2.2). Su fundamentación de la aritmética con estos medios impresiona 
todavía a ciertos filósofos, pero los matemáticos le han prestado muy poca 
atención. En todo caso, aunque no nos detengamos a examinar el formalis- 
mo de sus deducciones, vale la pena darle una mirada a las definiciones que 
introdujo para “reducir” los conceptos específicos de la aritmética a ideas 
básicas comunes a todas las áreas del pensamiento. La motivación y alcance 
de la empresa de Frege —y también la peculiar ceguera que la vicia— se 
apreciarán mejor si examinamos primero la obra contemporánea —mucho 
más influyente y, en mi opinión, más acertada— de Richard Dedekind y 
Giuseppe Peano.' 


2.3.1 Peano (1889) 


En 1889 Peano publicó la monografía Arithmetices principia, novo methodo 
exposita. En el largo prefacio presenta y explica la escritura conceptual in- 
ventada por él, que es el antecedente histórico directo de la que usamos hoy. 
El $ 1 contiene la primera versión publicada de los célebres Axiomas de 
Peano, que constituyen justamente el sistema de axiomas para la aritmética 
elemental cuya consistencia Hilbert y sus colaboradores intentarán demos- 
trar. Peano agradece a Boole, Schróder, Jevons, Peirce y MacColl sus apor- 
tes a la lógica y cita también el libro sobre aritmética de Dedekind (1888) 
que comentaré enseguida, pero no nombra a Frege, lo que me hace suponer 


Al redactar este capitulo tuve a la vista con mucho provecho la obra de Gillies (1982) 
y la Sección XIX del libro de Crispin Wright (1983). 
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que en 1889 todavía no lo conocía.? Reproduzco a continuación los Axio- 
mas de Peano, en la notación original (doy entre paréntesis una versión cas- 


tellana):? 
P1 len. 
(1 es un número.) 
P2 ae N.D.a+len. 
(Si a es un número, el siguiente de a es un número.) 
P3 a, beN.D.a=b.=.a+1=b+1. 
(Si a y b son números, a es igual a b si y sólo si el siguiente de a 
es igual al siguiente de b.) 
P4 aeN.D.a+l-=1. 
(Si a es un número, el siguiente de a no es igual a 1.) 
P5 keK.Do.lek.oxeNxek:D,.x+lek::O0.NOk 


(Si k es una clase tal que (1) 1 pertenece a k y (11) para todo objeto 
x, si x es un número y x pertenece a k, también el siguiente de x 
pertenece a k, entonces k incluye a toda la clase de los números.) 


En un artículo sobre “Los principios de la lógica matemática” aparecido dos años más 
tarde, Peano cita a Frege 1879, pero sólo para informar al lector que, “en vez de a D 


b, [Frege] escribe qn (Peano 1891, n. 5). El 30 de enero de 1894, contestando a una 
b 


carta de Frege, Peano le comunica que “j'ai acheté il y a quelques temps vos Die 
Grundlagen der Arithmetik [Frege 1884)” y el 3 de octubre de 1896 le cuenta que acaba 
de releer Begriffschrift (1879) y Grundgesetze (tomo I, 1893), “avec nouveau plaisir” 
(Frege, WB, p. 177, 189), pero no sabemos cuando leyó estas obras por primera vez. 
Peano publicó en 1895 una reseña del tomo I de Grundgesetze que dio lugar a una 
interesante respuesta de Frege. 


En el libro de Peano los axiomas P2-P5 llevan los números 6, 7, 8 y 9, respectivamen- 
te. Los números 2-5 corresponden a axiomas que gobiernan el uso entre números del 
signo “=”, el cual se emplea a la vez como símbolo de la equivalencia entre asevera- 
ciones y de la igualdad aritmética. Peano (1898) enuncia sólo cinco axiomas de la arit- 
mética, correspondientes a P1-P5 (supongo que esta simplificación se debe a que lle- 
gó a pensar como Frege que los axiomas que gobiernan el símbolo “=" en ambos usos 
pertenecen a la lógica general; cf. nota 5). Allí emplea el símbolo “0” en vez de “1” 
para designar al miembro distinguido de la clase N, esto es, el objeto que según P1 es 
un número y según P4 no es igual al siguiente de ningún número; con ello se evita la 
perniciosa confusión entre “1? y “+1” que comento en la nota 4. 
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En los enunciados de Peano figuran algunos signos de uso general que ha 
explicado en la presentación de su escritura conceptual, a saber, —, =, e, D, 
9,, la constante K y los puntos. Hay además tres símbolos nuevos, no defi- 
nidos, que son los primitivos de su aritmética, a saber, N, 1 y la expresión 
+1.* Antes de examinar la índole sintáctica de estos primitivos y las condi- 
ciones semánticas que les imponen los axiomas, conviene hacer algunas ob- 
servaciones sobre los signos de uso general. Peano dice que “K significa clase 
O agregado de entes”. Los puntos funcionan como los paréntesis en el álge- 
bra, entendiéndose que, en una fórmula dividida por puntos, se asocian, ante 
todo, los signos que no están separados por ningún punto; enseguida, los 
que están separados por un punto; luego, los que están separados por dos 
puntos, etc. Así, ab.cd:ef.gh..k significa lo mismo que 
(C(abKcW)MKCef(ghYWk. Aunque Peano no lo dice, debemos entender que la 
simple yuxtaposición de dos oraciones expresa la conjunción de éstas. 

Los demás signos de uso general corresponden, aunque no sin equívocos, 
a otros que utilizamos hoy. El signo =, escrito entre nombres de objetos, 
expresa la identidad de los objetos nombrados, como nuestro signo de la 
misma forma; pero Peano también lo escribe entre oraciones para expresar 
la equivalencia de éstas, como nuestro signo <> (cf. la segunda posición que 


También el signo “=” es un primitivo de la aritmética en Peano 1889 (además de servir 
como símbolo lógico de equivalencia), pero para nuestros propósitos es preferible no 
hacer caso de esta peculiaridad (por eso he omitido los axiomas “aritméticos” 2-4 que 
atribuyen a la igualdad entre números la consabida reflexividad, simetría y transitividad, 
y el axioma 5, que estipula que si a = b y a es un número, entonces b es un número). 
Es importante advertir que, aunque consta de dos caracteres, “+1” es un solo símbolo 
simple que representa la función unaria “el siguiente de...”. El signo “1” que vemos en 
él es sólo tipográficamente igual a la constante individual *1” que se usa en el axioma 
P1, y el signo “+” que lo precede no representa aquí la adición, es decir, la función 
binaria que asigna a cada par de números (x,y) el número que es la suma de x e y. 
Desafortunadamente, Peano utiliza en su libro el mismo signo *+” como símbolo de la 
adición, que define así en la Proposición 18: 


abeN.D.a+(b+1)=(a+b)+1 


Esto es: Si a y b son números, la suma de a y el siguiente de bh es igual al siguiente 
de la suma de a y b. Nótese que en esta definición el primer y el tercer signo “+” 
significan la suma (de los números que figuran a cada lado), pero el segundo y el cuarto 
se funden con el signo *1” para significar el siguiente (del último número a su izquier- 
da). 
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el signo = ocupa en P3).* El signo — significa negación, como nuestro sig- 
no —=; pero también expresa la operación booleana de formar el complemen- 
to (si a es una clase, —a es la clase formada por todos los objetos que no 
pertenecen a a). La sintaxis del signo de negación difiere de la actual: si a 
y b son objetos, ía —= b” significa 'a no es idéntico a b”, lo que ahora es- 
cribiríamos “(a = by” o, más informalmente, 'a 4 b”. 

El signo e es, por cierto, el antecedente histórico directo de nuestro signo 
e: en P5 la cláusula *1 e k” dice que el objeto llamado 1 pertenece a —es 
uno de los elementos de— la clase o colección de objetos llamada k. Pero 
Peano explica que e debe leerse “es” (¿cti en griego; e en italiano). Cabría, 
pues, entender este signo meramente como una cópula que une el sujeto 
mencionado a la izquierda con el predicado escrito a la derecha. Bajo esta 
interpretación la cláusula 'k e K” en P5 puede leerse “k es clase”, sin que 
haga falta suponer que hay una clase de todas las clases denotada por la 
constante K. 

Peano fue el primero en distinguir entre la relación de pertenencia a una 
clase (o conjunto), simbolizada por e, y la relación de inclusión entre clases 
(o conjuntos), simbolizada por J. Si a y b son clases, entonces a ) b si y 
sólo si, cualquiera que sea el objeto x, x e a implica que x e b. En esta fun- 
ción, ) corresponde pues a nuestro signo <. Pero D desempeña además otra 
función: si a y b son oraciones, entonces “a 9 b” significa, según Peano, que 
b se deduce de a. Esta explicación no es muy iluminadora ya que, debido a 
la ausencia total de reglas de inferencia explícitas, no es fácil determinar 
cuándo una oración se deduce de otra en su sistema. Con todo, Peano indica 
—en un pasaje citado en la nota 2— que si a y b son oraciones, “a D b” 
significa en verdad lo mismo que ahora expresamos con “a > b” (el lector 
percibirá la semejanza entre el signo D y la “herradura” > utilizada por 
Russell y otros en vez de la flecha >). El doble sentido del signo D es notorio 
en P3, pero también en la definición misma de Y como signo de inclusión 
(Peano 1889, Prefacio, Proposición 50): 


Como vimos en la p. 142, n. 21, también Frege utiliza su signo de identidad = para 
expresar la equivalencia entre oraciones. Pero en su sistema esto no constituye un uso 
equívoco de dicho signo, ya que, según él, una oración denota su valor veritativo. Ob- 
viamente, si dos oraciones son equivalentes, el valor veritativo que ambas denotan es 
uno y el mismo. 
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Aquí 9 significa inclusión cuando está escrito entre los nombres de clase a 
y b, pero significa implicación en los otros casos. Con el subíndice x que 
acompaña a la última implicación Peano quiere decir que ésta vale cualquie- 
ra que sea el objeto x. El subíndice x hace, pues, las veces de nuestro 
cuantificador universal Vx (en lugar de 'x e a. D,. x e b” hoy escribiríamos 
Vx(x e a >x € b)). Peano escribe asimismo =, para generalizar una equi- 
valencia. 

Las explicaciones precedentes, aunque tediosas, apuntan a una importante 
limitación común a toda escritura conceptual. Aunque se pretenda absoluta, 
la precisión que tal escritura confiere al pensamiento no será mayor que la 
que se logre discurriendo —para definirla y reglamentarla— en una lengua 
viva. Por otra parte, la escritura conceptual permite fijar ideas de un cierto 
grado de precisión y protegerlas —merced a la artificialidad y carencia de 
poder sugestivo de sus símbolos— contra la erosión por el torrente de pará- 
frasis y metáforas de que se nutre el discurso “natural”. 

Atendamos ahora a los primitivos N, 1 y +1. En los axiomas P1-P4, N 
figura siempre a la derecha del signo e. Por lo tanto, según la interpretación 
arriba mencionada, podríamos entender que N es un predicado, no el nom- 
bre de una clase o colección existente de objetos. Pero en P5 figura la cláu- 
sula N D k. De acuerdo con la Proposición 50 del Prefacio, esto sólo quiere 
decir algo si N e K. El axioma P1 dice que 1 es un elemento distinguido de 
esta clase N. Los axiomas P2-—P4 caracterizan la aplicación de N en N por 
x > x+ 1. P2 indica que se trata efectivamente de una aplicación con do- 
minio y codominio N, puesto que dice que para cada objeto a que pertenez- 
ca a N hay también en N un determinado elemento designado por a + 1. P3 
indica que esta aplicación es inyectiva (a + 1 =b+ 1 sólo si a = b).* P4 
dice que el objeto distinguido 1 no cae dentro del alcance de la aplicación x 
> x +1 (no existe un x e N tal que 1 = x + 1). Finalmente, P5 dice que la 


Según lo que llevamos dicho, la apódosis a=b.=.a+1=b+ 1 de P3 equivale a la 
conjunción de las dos condiciones a+ 1=b+1.D.a=bya=b.D.a+1l=b+ 
1. La primera de estas condiciones establece que la aplicación x > x + l es inyectiva. 
La segunda condición es superflua si entendemos, como parece natural, que la expre- 
sión a + 1 es un término y, como tal, designa un y sólo objeto. 
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clase N está incluida en cualquier clase k que reúna los dos requisitos si- 
guientes: (1) k contiene el elemento distinguido 1 y (11) si x es cualquier objeto 
contenido a la vez en N y en k, k contiene también el objeto x + 1 (que 
ciertamentemente existe, en virtud de P2, puesto que x e N). Por lo tanto, si 
entendemos —como parece haber entendio Peano— que cada propiedad atri- 
buible a objetos determina una clase formada por los objetos que tienen esa 
propiedad, el axioma P3 justifica un método para demostrar que una propie- 
dad es común a los objetos de la clase N. Sea k la clase formada por los 
objetos que tienen la propiedad k*. En virtud de P5, para probar que todos 
los objetos de la clase N tienen la propiedad k* (de modo que N I k) basta 
probar que 1 la tiene y que, sí la tiene cualquier x e N también la tiene el 
respectivo objeto x + 1. Este método de prueba se llama inducción matemá- 
tica (finita). 

Para apreciar mejor el potencial de los axiomas de Peano, consideremos 
un conjunto no vacío cualquiera N y una aplicación inyectiva o: N —= N, tal 
que un determinado objeto 1 e N queda fuera del alcance de o (Vx(x e N 
> o(x) + 1)). La estructura (N,0,1) evidentemente satisface los axiomas P1- 
P4, si entendemos que N es la clase N, que 1 es el objeto distinguido 1 y 
que o es la aplicación x > x + 1. ¿Qué condiciones adicionales tiene que 
cumplir (N,o,1) para que satisfaga además el axioma P5? En Was sind und 
sollen die Zahlen? (1888), Dedekind había dado a esta pregunta una respuesta 
que Peano no incorpora a su tratamiento del asunto, posiblemente porque 
cuando redactó Arithmetices Principia (1889) todavía no había estudiado bien 
aquel libro (que cita, sin embargo, en su Prefacio). Pero antes de hablar de 
ella, conviene tener presentes algunos ejemplos de estructuras que efectiva- 
mente satisfacen los cinco axiomas P1-P5. Sea N el conjunto de los símbo- 
los con que representamos los enteros positivos: N = (1, 2, 3,... y»; llame- 
mos 1 al símbolo 1 y o a la aplicación que asigna a cada símbolo el símbo- 
lo siguiente.” Entonces (N,0,1) satisface los cinco axiomas de Peano. Pero 


Nótese que digo los símbolos, no los objetos (números) que ellos supuestamente repre- 
sentan. Qué sean estos objetos es lo que Peano y Dedekind buscaban establecer. Para 
que el conjunto de símbolos (1, 2, 3,... j esté bien definido es preciso, claro está, 
disponer de una regla que determine la figura del sucesor inmediato de cualquier sím- 
bolo dado. Pero evidentemente disponemos de ella. ¿No sabe acaso el lector escribir 
en el acto el número que sigue a 37.045.622.876.359? Con un pequeño esfuerzo puede 
también sin duda nombrarlo, en castellano, en inglés y en cuántas lenguas conozca. 
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(N',0,1) también satisface los cinco axiomas de Peano si N =X0, 1,2,...) 
y ges como antes, pero 1 es el símbolo O. Fijémosnos por el momento en 
esta última interpretación. Sea N',< N el conjunto (0, n, 2n, 3n,... y, 1 el 
0 y o, la aplicación N,— N,, definida por 0,(x) = x + n. Basta una breve 
reflexión para convencerse de que los axiomas P1-—P3 están realizados en la 
estructura (N,,0,,1), si entendemos que la clase N de Peano es N,, que el 
objeto distinguido que él llama 1 es nuestro 1 (esto es, el símbolo 0), y que 
su aplicación inyectiva x > x +1 es 0, 


2.3.2 Dedekind (1888) 


En la obra citada, Dedekind quiso mostrar que “el concepto de número es 
enteramente independiente de las representaciones o intuiciones del espacio 
y del tiempo” y que puede considerárselo “un producto (Ausfluf8) inmediato 
de las puras leyes del pensamiento” (1893, p. vii).$ Estas palabras recuerdan 
el programa de Frege: probar que las verdades aritméticas se deducen de 
definiciones y leyes de la lógica. En el prólogo a la segunda edición Dedekind 
dice que leyó el libro de Frege, Grundlagen der Arithmetik (1884), un año 


Podríamos, pues, identificar N con cualquiera de los siguientes conjuntos de palabras: 
funo, dos, tres, ... , o fone, two, three, ... ), o (eins, zwei, drei, ... ), etc., y obte- 
ner otras tantas realizaciones de los axiomas de Peano. A primera vista, no parece que 
pueda sacarse mucho provecho del axioma P5 para demostrar propiedades del conjun- 
to N así interpretado, pues obviamente no hay ninguna conexión necesaria entre la fi- 
gura gráfica o fónica de uno de los símbolos o palabras en cuestión y la de su sucesor 
inmediato. Pero las propiedades interesantes que se prueban mediante P5 involucran 
funciones como la suma y la multiplicación, cuyas definiciones fundan tales conexio- 
nes. Se advertirá de paso que en cualquiera de estas interpretaciones WN no es un con- 
junto de objetos físicos —paquetes de ondas acústicas, inscripciones hechas con tiza o 
con lápiz— sino ideales: los prototipos pensables de tales símbolos o palabras. De hecho, 
la inmensa mayoría de esos prototipos no ha tenido nunca ni podría tener una realiza- 
ción física. 

No he tenido en mis manos un ejemplar de la primera edición de Dedekind 1888, sino 
sólo de la segunda (inalterada) de 1893. Por eso —y para facilitar la consulta de otras 
ediciones— mis citas remiten a los números (del 1 al 172) en que está dividido el 
texto en todas ellas. Esta convención, empero, no es aplicable al prólogo. 
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después de publicada la primera del suyo (1888), y que, considerando “la 
precisión con que el autor se expresa sobre la inferencia de na n + 1”, es 
claro que “aquí pisamos sobre el mismo terreno” (Dedekind 1893, p. xvii). 
Sin embargo, como veremos, hay una profunda diferencia entre ambos. Mucho 
más cerca está Dedekind de Cantor, con quien, como sabemos, tenía corres- 
pondencia (Capítulo 1.4). Dedekind parte introduciendo la noción de siste- 
ma (System), que yo no sabría distinguir de lo que Cantor llamaba *conjun- 
to” (Menge).? En aras de “la uniformidad de la dicción”, admite la existencia 
de sistemas “que constan de un objeto único” (esto es, de conjuntos unita- 
rios); pero descarta explícitamente “el sistema vacío, que no contiene nin- 
gún elemento [...], aunque para otras investigaciones puede ser cómodo 
inventarlo” (Dedekind 1888, +2). 

Básico es asímismo el concepto de aplicación (Abbildung), que Dedekind 
introduce así: 


Por aplicación q de un sistema S se entiende una ley en virtud de la cual 
a cada elemento determinado s de S pertenece (gehórt) una cosa determi- 
nada que se llama la ¿imagen (Bild) de S y se designa con q(s). Decimos 
también que q(s) corresponde (entspricht) al elemento s, que q(s) surge 
de s o es generado desde s por la aplicación q, y que por ella s se trans- 
forma en q(s) (úibergeht in q(s)). Si T es una parte cualquiera de S, la 
aplicación q de $ contiene a la vez una determinada aplicación de T' que, 
en aras de la simplicidad, podemos designar con el mismo signo q y que 
consiste en que a cada elemento £ del sistema T' le corresponde la misma 
imagen (tf) que £ posee como elemento de S. También el sistema que 
consta de todas las imágenes q(1) se llamará la imagen de T y se designa- 
rá con (7). Esto explica de paso el significado de la expresión (Ss). 
(Dedekind 1888, +21) 


He aquí una traducción del pasaje pertinente: 


En lo sucesivo entiendo por cosa (Ding) a cada objeto de nuestro pensamiento. [... ] 
Ocurre muy a menudo que diversas cosas a, b, c,..., consideradas por cualquier 
motivo bajo un punto de vista común, son reunidas en la mente (im Geiste zusammen- 
gestellt werden) y se dice entonces que forman un sistema S; las cosas a, b, C,... 
son los elementos del sistema S, están contenidas en S. Por su parte, $ consta de 
(besteht aus) estos elementos. Como objeto de nuestro pensamiento, un tal sistema S 
[..... J es también una cosa; está completamente determinado cuando respecto de cada 
cosa está determinado si ella es o no es un elemento de S. 

(Dedekind 1888, +41+1,2) 
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Este concepto de Dedekind concuerda no sólo en el nombre con lo que en 
alemán ahora se llama Abbildung (“aplicación”* en castellano). Sorprende un 
tanto el aserto de que una aplicación es una ley, pues las aplicaciones a que 
Dedekind de hecho se refiere en su libro pueden ser —como las nuestras — 
correspondencias enteramente arbitrarias. Igual que en la matemática actual, 
una aplicación está individualizada aquí por su dominio, esto es, por el par- 
ticular sistema a cuyos elementos ella asigna “imágenes” (en contraste con 
las funciones de Frege que son, por así decir, aplicaciones del universo en- 
tero). Por eso Dedekind distingue con primor inusitado en su tiempo entre 
una aplicación q definida en un conjunto S y la restricción de q al subconjunto 
TC S (aunque, “en aras de la simplicidad”, usa la misma letra q para desig- 
nar a ambas). El lector echará de menos en el pasaje trascrito una referencia 
al sistema de donde la aplicación (p toma sus imágenes, o sea lo que hoy 
llamamos el codominio de q. Dedekind introduce este concepto más adelan- 
te y enseña a describir una aplicación —como se hace hoy —nombrando su 
dominio y su codominio: 


Si q es una [... ] aplicación de un sistema S y q(S) es una parte de un 
sistema Z llamamos a q una aplicación de S en Z, y decimos que S es 
aplicada por q en Z. 

(Dedekind 1888, 136) 


Pero no insiste —como haríamos hoy— en que el codominio de una aplica- 
ción también contribuye a individualizarla.'' 

Dedekind llama “aplicación similar” (áihnliche Abbildung) a lo que hoy 
llamamos una aplicación inyectiva. Dos sistemas son similares si uno de ellos 


Esto se debe, seguramente, a la índole misma de las aplicaciones que Dedekind consi- 
dera en su libro. El codominio B de una aplicación f: A—> B cobra importancia como 
factor individualizador cuando atendemos a las propiedades inherentes a f en virtud de 
las estructuras características de A y B. Por ejemplo, si es una superficie curva en el 
espacio euclidiano 8, la métrica estándar de é induce una métrica en $ (que determi- 
na, por ejemplo, cuales son las rutas más cortas que puede seguir una hormiga que 
camina sobre $). La inclusión u: Y — 8, x => x, que asigna a cada punto x de la 
superficie F el mismo punto considerado como elemento del espacio 8, difiere enton- 
ces de la identidad I;y: P- = %, x => x, puesto que I.¿es una isometría, pero t normal- 
mente no lo es (dos pares de puntos equidistantes en generalmente no equidistan en 


€). 
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es la imagen de una aplicación similar del otro. En otras palabras, el sistema 
S, es similar al sistema S, si hay una aplicación inyectiva q: S, — S, tal que 
p(S¡) = S,. En tal caso, decimos hoy que q es biyectiva. Evidentemente, si 
S, es similar a S,, ambos sistemas son equinumerosos. Valiéndose de este 
concepto, Dedekind construye su célebre definición de infinito: Un sistema 
S es infinito si y sólo si es similar a una parte propia de sí mismo, esto es, 
si y sólo si hay una aplicación inyectiva q: S = S tal que q(S) + S.!! 
Dedekind “demuestra” el siguiente “teorema”: Hay sistemas infinitos (1888, 
166).? 

Para explicar cómo Dedekind concibe la aritmética tenemos que definir el 
término “cadena”. Sea S un sistema cualquiera y q una aplicación de S en S. 
Una parte K de S es una cadena (Kette) con respecto a p si K incluye su 


Intuitivamente diríamos que un conjunto S es infinito si y sólo si ningún número natu- 
ral es suficientemente grande para enumerar a S, esto es, si y sólo si 1Sl > lol. Pero 
Dedekind quiso tener un concepto de infinito utilizable en la caracterización de los 
números naturales. Es fácil comprobar que todo conjunto infinito en el sentido de 
Dedekind también es infinito en el sentido intuitivo (pues necesariamente incluye, como 
se verá más adelante, un conjunto equinumeroso con (wm). Mas para establecer la equi- 
valencia de ambos conceptos se requiere el Axioma de Selección. Dedekind lo utiliza 
de hecho implícitamente en su demostración de que cualquier conjunto que sea 
equinumeroso con (w puede biyectarse sobre una parte propia suya (1888, 11159). 


Dedekind razona así: Sea G el sistema de todas las cosas que pueden ser objeto de mi 
pensamiento. Si g es un elemento cualquiera de G, llamaré g' al pensamiento de que g 
puede ser objeto de mi pensamiento. Obviamente, g' también es un elemento de G. La 
aplicación q: g > g' es una inyección de G en G (ya que, si g + £, el pensamiento de 
que g puede ser objeto de mi pensamiento es distinto del pensamiento de que f puede 
ser objeto de mi pensamiento). No todo elemento de G pertenece a p(G) (ya que hay 
objetos posibles de nuestro pensamiento que no son pensamientos acerca de otros ob- 
jetos). Por lo tanto, G es infinito. (Boolos 1990 hace interesantes observaciones sobre 
este argumento de Dedekind). 


Años más tarde, Dedekind retirará esta “prueba” porque la suposición de que existe 
el sistema G lleva directamente a las paradojas de la teoría de conjuntos, aunque ex- 
presaba todavía la confianza en que “una investigación rigurosa de la capacidad crea- 
dora del espíritu para formar con elementos determinados un nuevo [objeto] determi- 
nado, su sistema, que necesariamente se distingue de cada uno de esos elementos, 
conducirá sin duda a una reformulación de los fundamentos de mi escrito que supere 
todas las objeciones” (citado por Webb 1980, p. 63). Como vimos en el Capítulo 1.8, 
los conjuntistas del siglo XX simplemente postulan que existe al menos un conjunto 
infinito. Es más claro y honesto. 
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propia imagen (K). En otras palabras, un sistema K es una cadena con res- 
pecto a una aplicación q: S —= S sí y sólo si p(K) < KC S. En aras de la 
brevedad diré “p-cadena” en vez de “cadena con respecto a q”. Obviamente, 
el propio sistema S es una q-cadena. Consideremos ahora una parte cual- 
quiera A < S. La p-cadena de A —designada en el libro de Dedekind por 
Ay— es la intersección de todas las p-cadenas que incluyen a A. Obsérvese 
que, si A mismo es una cadena, A, = A. Si x es un elemento cualquiera de S, 
llamaré “la p-cadena de x” y designaré —como Dedekind— con xy a la q- 
cadena del sistema (xP cuyo único elemento es x. (Lamentablemente, la nota- 
ción Ag, Xy, no Indica la aplicación con respecto a la cual estos sistemas son 
cadenas; pero la usaré sólo en contextos en que no hay peligro de confu- 
sión). !* 

Dedekind demuestra el siguiente Teorema de la Inducción Completa (Satz 
der vollstándigen Induction; en adelante, TIC): Sean q: S=>S,ACS y Ap 
la p-cadena de A; sea 2 un sistema cualquiera (incluido o no en S). Para que 
A, esté incluida en 2 (4, < 2) son suficientes estas dos condiciones: (1) A < 
2 y (1i)x € Ay N 2 sólo si p(x) e 2. En efecto, si se cumple la condición 
(1), A < Ap N E, de modo que el sistema G = Ay N Y existe.!* Tenemos que 
A << GC Ap. Como Ay es una q-cadena, x € Ay > Q(x) € Ay. Por lo tanto, 
p(G) < Ap. Por otra parte, (11) implica que p(G) < 2. Por lo tanto, si (11) es 
verdad, tenemos que p(G) < G. G es, pues, una (-cadena, una de las q- 
cadenas que incluyen a A. Por lo tanto, Ay < G < 2. Q.E.D. 


Anoto un resultado al que me referiré más adelante: Cualesquiera que sean la aplica- 
ción q: $ —= $ y el subsistema A C S, p(Ap) = (p(A),: la q-imagen de la p-cadena es 
la p-cadena de la p-imagen (Dedekind 1888, 157). Para probarlo, demostramos prime- 
ro el siguiente lema: Si hay una q-cadena L tal que p(4) c £, también hay una q- 
cadena K tal que A < K y q(K) c L. En efecto, sea K=A U L. Entonces A c K y q(K) 
= (A) U Q(L). Como (A) < £ (por hipótesis) y p(L) < £ (porque L es una p-cade- 
na), p(K) < L < K. Por lo tanto, K es una p-cadena. Sea, pues, (p(4)), = L. Entonces 
L es una q-cadena tal que p(A) < L y —en virtud del lema— existe una p-cadena K 
tal que A < K y Qq(K) c L. Por lo tanto, A, < K (ya que A), es la intersección de todas 
las cadenas de que A es parte), de suerte que p(Apy) < p(K) < L = (p(A))p. Por otra 
parte, p(A) € (Ap) (dado que A < Ap) y E(P(A/)) < 0(A,) (dado que p(A,) < Ap). En 
otras palabras, p(A¿) es una p-cadena que incluye a p(4). Por lo tanto, (p(A))y < P(Ap) 
(pues (p(A4)), es la intersección de todas las p-cadenas que incluyen a p(4)). Resulta, 
pues, que p(A/) = (p(4),. Q.E.D. 

Hoy diríamos “de modo que A¿ N 2 % 2”. Como Dedekind no reconoce la existencia 
del sistema vacío, para él un sistema existe si y sólo si contiene elementos. 
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El TIC es inmediatamente aplicable a la estructura (N 0,1) descrita en las 
pp. 150-51, en que o: N = N es inyectiva y 1 e N pero 1 £ o(N). Estas 
características implican que (N,o,1) satisface los primeros cuatro axiomas 
de Peano. Ahora podemos ver, a la luz del TIC, que (N,o,1) satisface ade- 
más el axioma P5 si y sólo si N es la o-cadena de 1 (si N = 1,, en la no- 
tación de Dedekind). En efecto, en virtud de ese teorema, 1, es parte de 
cualquier sistema k si (1) (1) Ek y (11) x € ly Ak implica que o(x) e Kk. 
Ahora bien, (i) equivale a la cláusula 1 e k (“1 e k”) del axioma P5; por 
otra parte, si N = 1p, (ii) dice precisamente que Vx((x e N nx e k) > o(x) 
ek)(xeN.xek:)D,.x+ l e k). Por lo tanto, bajo las condiciones 
antedichas, N' — k. Por otra parte, si N + 1, tenemos que N z 1, aunque 1 
e loysixeNyxe lo, o(x) e 1,. Por lo tanto, si N + 1p, el propio 
sistema 1, proporciona un ejemplo de una colección de objetos que reúne 
las condiciones prescritas a k en el axioma P5 y sin embargo no incluye a 
N. 

De este resultado se deduce sin dificultad la importante conclusión siguien- 
te: Supongamos que o: S —> S es una aplicación inyectiva cualquiera y que 
existe un objeto 1 e S tal que 1 £ o(S) (el lector recordará que esto sólo es 
posible si S es un sistema infinito en el sentido de Dedekind). Entonces, si 
1, denota la o-cadena de 1 y entendemos que 1, es N, 1 es 1 y o es la 
aplicación x > x + 1, la estructura (1,,0,1) satisface los axiomas P1-P5 y 
puede por lo tanto prestar todos los servicios que la matemática espera de 
los números naturales. En efecto, (1/,0,1) satisface P1—P4 por la forma cómo 
la hemos definido y satisface P5 en virtud del TIC, puesto que 1, es la o- 
cadena de 1. Este argumento demuestra que todo sistema infinito en el sen- 
tido de Dedekind incluye un subsistema capaz de brindar un modelo de los 
axiomas de Peano. 

En 1888 Dedekind no menciona, por cierto, los axiomas publicados por 
Peano en 1889, pero caracteriza el tema de la aritmética elemental como acabo 
de hacerlo. Dice que un sistema N se llama simplemente infinito si hay una 
aplicación similar (esto es, inyectiva) p de N en N tal N es la p-cadena de 
un elemento suyo que no pertenece a p(W). Dedekind denota este elemento 
con el signo “1” y lo llama el elemento básico (Grundelement) de N. Dice 
también que el sistema simplemente infinito N está ordenado por la aplica- 
ción q. “La esencia de un sistema simplemente infinito N consiste pues en 
la existencia de una aplicación p de N y un elemento 1 que satisfagan las 
condiciones siguientes:” 
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NE TPL 


WN) EN. 
N = 1, (la p-cadena de 1). 


lg own. 


p es similar (inyectiva).!* 


El estudio de esta esencia es la tarea propia de la aritmética, como indica la 
siguiente: 


DEFINICIÓN. Si en la consideración de un sistema simplemente infinito N 
ordenado por una aplicación q, uno prescinde completamente de la parti- 
cular índole de sus elementos, se fija meramente en que es posible distin- 
guirlos y atiende sólo a las relaciones mutuas en que los pone la aplica- 
ción ordenadora «(, dichos elementos se llaman números naturales O nú- 
meros ordinales o simplemente números y el elemento básico 1 se llama 
el número básico (Grundzahl) de la serie numérica N. [... ] Las relacio- 
nes O leyes que se derivan pura y exclusivamente de las condiciones a, f, 
y, 6 en el 471 y por ende son siempre las mismas en todos los sistemas 
ordenados simplemente infinitos, —cualesquiera que sean los nombres que 
casualmente se asignen a los elementos particulares— constituyen el ob- 
jeto inmediato de la ciencia de los números O aritmética. 

(Dedekind 1888, 173) 


A mi modo de ver, esta visión de la aritmética elemental como la teoría de 
los sistemas simplemente infinitos queda plenamente vindicada cuando 
Dedekind define en sus términos la relación “mayor que” y las funciones 
aritméticas básicas: suma, multiplicación y exponenciación (de enteros posi- 
tivos). Digamos con él que u es el número siguiente a v si u y v pertenecen 
al sistema simplemente infinito N ordenado por la aplicación y y u = p(v). 
Dedekind demuestra que, aparte del elemento básico 1, todo elemento de N 
es el número siguiente a otro elemento de N.'* Por otra parte, es fácil ver 


Dedekind 1888, +F71. He colocado el texto de los postulados a.-Ó fuera de la cita entre 
comillas porque no uso la misma notación que Dedekind. 

En efecto, si f: S — S es cualquier aplicación y A < S, la f-cadena de A, A¿=A4 U 
fF(A,) (Dedekind 1888, +58). Por lo tanto, N = 1, = (1) U (y) = 1 U EW). La citada 
proposición 4:58 se prueba así: Por la proposición +57 (demostrada en la nota 13), f(Ap) 
= (f(4)),. Para abreviar, estipulamos que L = f(Ap) y K=A U L. Entonces f(4) < L 
(ya que A C Ap) y, como £L es una f-cadena, la demostración del lema utilizado en la 
nota 13 para probar la proposición +57 indica que también K es una f-cadena tal que 
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que ningún x e N está contenido en la p-cadena (p(x))) del número siguiente 
a x.!” Sea K una q-cadena cualquiera y n e N. Basándose en las dos propo- 
siciones recién citadas, Dedekind establece que (1) sin £ K, K< (ng); (1) 
sing K pero p(n) e K, K= q(n); (111) hay un y sólo un k e K tal que K 
= ko y (iv) sinx*m e N, ny € q(mp) si y sólo si my Z p(ny).'* Dedekind 
ofrece la siguiente definición: Si n, m e N, n es mayor que m (simbólica- 
mente: n > m), si y sólo si ny < q(my). En virtud de los resultados antedichos, 
cada par de números n, m e ÑN satisface una y sólo una de las tres relaciones 
siguientes: n > m, o n= m, o m > n.'? Dedekind define luego recursiva- 
mente la suma, la multiplicación y la exponenciación. Pero antes demuestra 
el importante Teorema de la Definición por Inducción, que asegura la 
univocidad de las definiciones recursivas (Dedekind 1888, 14126). Mediante 
este teorema Dedekind demuestra asimismo que entre dos sistemas simple- 
mente infinitos cualesquiera hay una única aplicación biyectiva que asigna 
al elemento básico del uno el elemento básico del otro y al siguiente de cada 
elemento del primer sistema el siguiente del elemento correspondiente del 
segundo. En virtud de ello, obviamente, todos los sistemas simplemente in- 
finitos son intercambiables en su papel de “serie numérica” y el tema de la 
aritmética resulta ser precisamente la estructura realizada en cualquiera de 


ACK y f(Oc L. Como A, es la intersección de todas las f-cadenas que incluyen a A, 
Ay < K. Por otro lado, A < Ay y L= f(4p) < Aj. Por lo tanto, K=A UL C Ay, de 
suerte que K = Ap. 

En efecto, el elemento básico 1 £ (p(1)),, puesto que 1 £ q(WV) y —en virtud de 
Dedekind 1888, 57 (demostrado en la nota 13)— q(W) = p(1p) = (p(1)),. Suponga- 
mos ahora que la tesis vale para un cierto n e N. Sea p el número siguiente a n. Te- 
nemos, pues, que n £ py y por ende difiere de cada q e py. En consecuencia, para 
cada q € Po, p = 0(n) + (q) e 0(po) = (o(p)y la desigualdad se debe a que q es 
inyectiva; la última igualdad se basa en el citado 457). Por lo tanto, si la tesis vale 
para n vale también para el número siguiente a n. En consecuencia, por el TIC, vale 
para todos los elementos de N. Q.E.D. 

Las proposiciones (1), (11), (111) y iv) se enuncian y demuestran en Dedekind 1888, ++485, 
86, 87 y 88, respectivamente. 


Sin =m, ny = my. Como m e my pero m £ q(mp,) —por la proposición demostrada en 
el nota 17—, tenemos que ny Z p(mp), es decir, que n > m. Intercambiando n y m en 
este argumento concluimos que sim = n, m > n. Por otra parte, si n 4 m, la proposi- 
ción (iv) implica que se cumple una y sólo una de las alternativas: n > m, m >n. 
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ellos. Me refiero a estos asuntos en el Apéndice XI (véase también el Apén- 
dice VIT. 


2.3.3 Frege (1884) 


En su definición de la aritmética Dedekind adopta resueltamente lo que hoy 
llamamos una concepción estructuralista de las matemáticas. Desde este punto 
de vista cualquier sistema de cosas —no importa su origen y condición — 
constituye el objeto de una determinada disciplina matemática en cuanto se 
logra concebirlo como una realización de la especie de estructura que es el 
tema propio de esa disciplina. Ello permite entender que las matemáticas sean 
no —como se ha dicho a veces irreflexivamente— el lenguaje de la cien- 
cia, pero sí un componente principal del pensamiento científico. El estruc- 
turalismo matemático asoma ya en los escritos de Leibniz, y Newton descri- 
bió en una oportunidad el espacio y el tiempo absolutos como sistemas de 
objetos individualizados exclusivamente por sus relaciones mutuas.?! Pero fue 
durante el gran florecimiento de las matemáticas en el siglo XIX que el punto 
de vista estructuralista se fue imponiendo, sin hacer ruido, a sus practican- 
tes. Se ha destacado con justicia la contribución de la geometría proyectiva 
a este proceso (Nagel 1939, Freudenthal 1974). Permítaseme mencionar sin 
comentarios el hecho siguiente: si 4 es un haz de rectas en el espacio ordi- 
nario —es decir, si Jf es el sistema de todas las rectas que concurren en un 


punto dado— y llamamos “punto” a cada recta de Jl y “recta” a cada plano 
El discurso científico se conduce en castellano, inglés, chino, etc. Algunos fragmentos 
sencillos se han traducido a una que otra escritura conceptual: BS, CP1=, etc. Pero 


sería grotesco pretender que las matemáticas son uno de estos “lenguajes”. 


21 “Del mismo modo que las partes del tiempo se individualizan por el orden, de suerte 


que, por ejemplo, si el día de ayer pudiera permutar su orden con el día de hoy y 
tornarse posterior perdería su individualidad y ya no sería más el día de ayer sino el de 
hoy; así también las partes del espacio se individualizan por sus posiciones, de modo 
que si dos cualesquiera de ellas pudiesen permutar sus posiciones, permutarían a la vez 
su identidad y cada una se convertiría como individuo en la otra. Sólo en virtud del 
orden y las posiciones relativas se conciben las partes del tiempo y del espacio como 
siendo esas mismas que de veras son; y no tienen otro principio de individuación que 
ese orden y esas posiciones, las cuales, por lo tanto, no pueden cambiar” (Newton, 
“De Gravitatione et equipondio fluidorum”, en Hall y Hall 1978, p. 103). 
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determinado por dos de ellas, entonces 36, así descrito, realiza todos los teo- 
remas de la geometría proyectiva plana. Sorprende por eso que Frege, cuya 
tesis doctoral (1873) versó sobre un tema de geometría proyectiva, haya re- 
sistido el enfoque estructuralista aun allí donde, como en la teoría axiomática 
de la geometría de Hilbert, su necesidad saltaba a la vista.2? La diferencia 
esencial entre su fundamentación de la aritmética y la propuesta por Dedekind 
se debe justamente a esta extraña resistencia —o, mejor dicho, ceguera— de 
Frege. Así como los teólogos demandan un concepto de Dios que no tenga 
más que un solo ejemplar, Frege exige una definición de número que certi- 
fique la unicidad del uno, el dos, el tres, etc. Como veremos, esta exigencia 
lo indujo a la contradicción que arruina su teoría.2 

La primera contribución importante de Frege a la fundamentación de la 
aritmética aparece en la tercera parte de Escritura conceptual (1879, pp. 53— 
87). Consiste en la demostración de varios teoremas de lo que Frege llama 
“Teoría general de las series (allgemeine Reihenlehrey”. Uno de ellos pro- 
vee, como el TIC de Dedekind, una justificación directa para la inducción 
matemática finita. Camuflados en la escritura BS, estos resultados de Frege 
no llamaron la atención de Dedekind y Peano cuando elaboraban sus teorías 
de la aritmética. Como suele ocurrir en matemáticas, el genio del autor se 


2 Sobre los Fundamentos de la geometría (Hilbert 1899) Frege y Hilbert intercambian 


cartas —reproducidas en Frege WB, 60-76— en diciembre de 1899 y enero de 1900. 
La obra es objeto también de dos artículos muy críticos de Frege (1903a, b). Es perti- 
nente asímismo la correspondencia de Frege con el joven matemático Heinrich 
Liebmann, hijo de su colega Otto Liebmann, y ayudante a la sazón en Góttingen, quien 
le había procurado un ejemplar de los apuntes —autorizados por el profesor— del curso 
“Elementos de geometría euclidiana” (invierno de 1898/99) en que Hilbert presentó su 
axiomatización. El 29 de julio de 1900 Frege devolvió este trabajo a Liebmann con 
una carta en la que le dice que, “aunque contiene varias invenciones ingeniosas, en 
conjunto lo estimo malogrado (verfehlt) y utilizable sólo tras mucha crítica” (WB, pp. 
147s.). Resnik 1980, cap. 3, contiene una buena exposición de “La controversia entre 
Frege y Hilbert”. Aunque, a mi modo de ver, Resnik exagera los aciertos del primero, 
admite que “Frege no apreció el potencial de la obra de Hilbert para la matemática en 
general”, mostrándose “ciego” en un grado que nos resulta “chocante (shocking)” para 
la evidente analogía entre la axiomática hilbertiana y lo que él mismo había hecho con 
la aritmética (p. 114). 


2 En definitiva, no hay multiples sistemas numéricos que realicen la teoría de la aritmé- 


tica de Frege porque, como ella es contradictoria, simplemente no hay ninguno. No 
faltará quien vea aquí otro paralelo con la teología. 
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manifiesta principalmente, no en la derivación misma de los teoremas —ta- 
rea relativamente fácil una vez bien planteada— sino en la selección de los 
conceptos apropiados para formularlos. Así como Dedekind da con el con- 
cepto muy simple y general de cadena —del que la serie numérica resulta 
ser un ejemplo— y demuestra el TIC para toda cadena, así Frege introduce 
los conceptos no específicamente aritméticos de serie determinada por un 
procedimiento y propiedad hereditaria en una tal serie y prueba teoremas 
sobre tales propiedades. Según Frege, “la inferencia de na n + 1” —esto es, 
la inducción matemática finita— se puede reducir a las leyes lógicas única- 
mente a través de estos conceptos ideados por él (Frege 1884, p. 93). 

Para no cansar al lector, explicaré los conceptos de Frege en castellano 
salpicado con fórmulas de la lógica actual.2? Me tomo además la libertad de 
reemplazar los ideogramas churriguerescos que Frege usa para representar- 
los por otros mucho más sencillos. Numero las explicaciones para facilitar 
su consulta. 


csi Las palabras “se puede ... únicamente” corresponden a la frase alemana “wird es allein 


móglich* empleada por Frege. Con ella expresa una apreciación singularmente exage- 
rada de su propia obra. Como vimos, Dedekind no necesita los conceptos fregeanos 
para llegar al TIC con una soltura y elegancia que una persona condenada a leer úni- 
camente a Frege no se soñaría siquiera. Claro que el TIC es un teorema de una teoría 
general de conjuntos, y como tal —diríamos hoy— no logra reducir la inducción ma- 
temática a “leyes lógicas universales”. Pero inmediatamente después de probar el TIC 
en la versión conjuntista que hemos visto (Sección 2.3.2), Dedekind da un paso que — 
tomado al pie de la letra— reduciría en efecto la teoría de conjuntos a la lógica, si no 
la hiciera inconsistente. Me explico: El TIC enuncia ciertas condiciones que aseguran 
que una cadena A, está incluida en un dado sistema 2. Por lo tanto, según Dedekind, 
el TIC puede invocarse para establecer que todos los elementos de A, tienen cierta 
propiedad (€ (o cumplen con la condición especificada en cierta oración S): basta su- 
poner que * designa “el sistema de todas las cosas que poseen la propiedad E (o para 
las cuales vale la oración S)” (1888, ++60). Pero el supuesto de que existe, para cada 
propiedad (E (o condición S), el sistema de las cosas que poseen U (o satisfacen S) 
implica, como sabemos, la paradoja de Russell. Gracias a Dios, para edificar la aritmé- 
tica 4 la Dedekind no hace falta entender literalmente el pasaje citado: basta suponer 
que * designa el sistema de todos los elementos de A, que tienen la propiedad E (o 
cumplen con la condición S). Así restringido, el supuesto no implica, que yo sepa, 
contradicción alguna. 


en Véase el Apéndice IX. Adviértase que para explicar a Frege no puedo limitarme a uti- 


lizar el conocido cálculo de primer orden que allí se explica en detalle, sino que debo 
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[SO] Un “procedimiento” (Verfahren), en el sentido de Frege, es sim- 
plemente una relación binaria. Si R es un procedimiento y Ruv, 
diremos con Frege que v resulta de aplicar R a u. 


En la explicaciones siguientes me refiero a un procedimiento arbitrario pero 
fijo que — imitando a Frege— designo con la letra minúscula f. 


[S1] Una propiedad F es hereditaria en la serie determinada por f 
(simbólicamente: ÍjF) si y sólo si Vu(Fu —> Vv(fuv > Fv)), 
esto es, si y sólo si, cuando un objeto v resulta de aplicar f a un 
objeto u que tiene la propiedad F, v también tiene la propiedad 
F. En vez de “la serie determinada por f” diré “la f-serie” y en 
vez de “hereditaria en la f-serie” diré *f-hereditaria”. 

[S2]  u f-precede a v y v f-sucede a u (simbólicamente: u <y v) si y 
sólo si VF(SpF > (Vw(fuw —> Fw) > Fv)), esto es, si y sólo 
s1, cualquiera que sea la propiedad F, v tiene F si F es f-heredi- 
taria y si el resultado de aplicar f a u siempre tiene F. 

[S3] yv pertenece a la f-serie iniciada con u y u pertenece a la f- 
serie que llega a v (simbólicamente: u <; v) si y sólo si u = v O 
U <p V. 

[S4] Supongamos ahora que f es un procedimiento tal que fuv y fuw 
sólo si v = w. En tal caso, decimos con Frege que f es un pro- 
cedimiento unívoco (eindeutig).?? Como puede verse, un proce- 
dimiento unívoco es simplemente una aplicación de todo el uni- 
verso de objetos en sí mismo: fxy si y es el valor de tal aplica- 
ción en el argumento x. 


ocasionalmente recurrir al cálculo de segundo orden esbozado en la sección G de di- 
cho apéndice. Éste envuelve cuantificación sobre variables predicativas. Por ejemplo, 
la fórmula IRVXVy(Rxy > —(x = y)) dice que hay una relación binaria R que subsiste 
sólo entre objetos no-idénticos. 


e 
26 Frege escribe If(3,e) para decir que el procedimiento f es unívoco. Este es el más 
5 


sencillo de los ideogramas que emplea para representar los cuatro conceptos definidos 


arriba. 
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Los teoremas de la teoría de las series presentada en Frege 1879 se dedu- 
cen de estas las definiciones [S1]-[S4] y los axiomas lógicos enunciados en 
la Capítulo 2.2 (y en el Apéndice X), mediante las reglas de inferencia men- 
cionadas en dicho capítulo (esto es, modus ponens y una regla tácita de sus- 
titución de variables). La proposición siguiente constituye el fundamento de 
la inducción matemática finita: 


8l. (Ex > (OF > (1 <52> Fa) 


(S1 F es una propiedad f-hereditaria y x tiene 
F y z f-sucede a x, z también tiene F). 


Obsérvese cuánto más general que el TIC de Dedekind es este “teorema de 
la inducción” fregeano. Aquél es relativo a una aplicación arbitraria p, pero 
la operación f a que éste se refiere no tiene que ser una aplicación: es lisa 
y llanamente una relación binaria cualquiera. La demostración es facilísima, 
si tenemos presentes las definiciones de “propiedad f-hereditaria” y *f-suce- 
de”. La proposición 81 queda establecida si probamos que Fy está implicada 
por la conjunción de las tres premisas siguientes: (1) Fx, (11) SF , o sea, Vu(Fu 
> Vv(fuv > Fv)) y (iii) x <s y, esto es, VG(H¿G > (Vv(fxv > Gv) > 
Gy)). La conjunción de (1) y (11), combinada con el Axioma 58, implica que 
(1v) Vv(fxv > Fv)). La conjunción de (11) y (111), combinada con el Axioma 
58, implica que (v) (Vv(fxv > Fv) > Fy).7 La conjunción de (iv) y (v) 
implica Fy. Evidentemente, si entendemos que x denota el primer número 
natural y fuv significa *v es el siguiente del número u”, la proposición 81 
combinada con la regla modus ponens autoriza la inducción matemática fini- 
ta. 

Convencido de que la aritmética sólo puede ser una ciencia si sus asertos 
se refieren a objetos bien determinados, Frege dedica la parte positiva de 
Fundamentos de la aritmética (1884) a establecer qué objetos son los núme- 
ros. No puedo examinar aquí las otras soluciones de esta cuestión que Frege 


27 En esta segunda aplicación del Axioma 58, (VxD(x) > D(a)), hay que entender como 


Frege que la variable ligada x puede ser predicativa y por ende puede ser sustituida 
con la variable I' que aparece ligada en la premisa (iii). Frege nos pediría sustituir en 
(VxD(x) > D(a)), x por T, a por O, y D(I>) por (91 > (Vv(fxv > Tv) > Py); cf. 
p. 131, nota 6. 
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fustiga en la parte inicial —negativa— de su libro, aunque la crítica devas- 
tadora a que las somete contribuye decididamente a motivar la suya. Los 
objetos que propone —si existiesen de veras— constituirían, como veremos, 
la serie determinada por cierto procedimiento, de modo que la teoría de 1879 
les sería aplicable. 

Frege procede a averiguar qué son los números examinando el modo como 
corrientemente se habla de ellos. Para eso disponemos de palabras (y sig- 
nos) —uno, dos, tres, cuatro ... (1,2,3,4,...)— que llamaré numerales. 
También tenemos reglas precisas para construir nuevos numerales cada vez 
que sea menester. Ahora bien, en la conversación cotidiana los numerales 
funcionan como atributos o predicados — “estas tres gallinas pusieron ayer 
cinco huevos”, “la semana tiene siete días”, “hay ochenta mil soldados pafla- 
gonios en Moronesia”. Por esto, los manuales de gramática clasifican a los 
numerales como adjetivos. Sin embargo, en la fraseología matemática se 
comportan como sustantivos, según puede verse en los siguientes ejemplos: 
“cuatro es el cuadrado de dos”, “once es el único número primo mayor que 
siete y menor que trece”, “el dos, el tres y el siete son los únicos divisores 
primos del 42”. Frege dice que le interesa concebir la noción de número en 
la forma en que es utilizable por la ciencia, así que no se dejará turbar por 
el hecho de que en la vida diaria los numerales también se usan atributiva- 
mente (1884, p. 69). Además, cualquier expresión en que un numeral se usa 
de este modo es fácilmente sustituible por otra equivalente en que se lo 
emplea como sustantivo; así, en vez de “la semana tiene siete días? siempre 
puedo decir —si no me importa parecer afectado— “el número de los días 
de la semana es igual a siete”. No obstante esta advertencia, Frege aborda su 
tema con una pregunta que concierne directamente al uso atributivo (y pre- 
dicativo) de los numerales, como quiera que se lo disimule con transforma- 
ciones sintácticas. Cuando empleamos un numeral como adjetivo ¿a qué — 
o a quién— le atribuimos una propiedad? La respuesta parece obvia: la pro- 
piedad significada mediante un adjetivo se atribuye (en castellano) al objeto 
nombrado por el sustantivo que dicho adjetivo califica. Así, el aserto sobre 
las fuerzas armadas de Paflagonia atribuye a los soldados de esa nación 
estacionados en Moronesia la propiedad de ser ochenta mil. Frege descarta 
esta respuesta debido a que la presencia militar paflagonia en Moronesia 
también se puede describir correctamente como un ejército, cinco divisio- 
nes, cuarenta regimientos, ciento sesenta batallones. La propiedad expresada 
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por el numeral “ochenta mil” no se atribuye, pues, a la realidad concreta 
nombrada en nuestro aserto, sino al concepto de soldado paflagonio en 
Moronesia mediante el cual se refiere a ella. Este argumento fregeano no 
tiene en cuenta, al parecer, que aunque una misma realidad exhiba distintas 
propiedades según el concepto adoptado para objetivarla, ellas son propieda- 
des del objeto captado, no del concepto bajo el cual se lo capta. Cuando leo 
Las Bacantes leo a la vez una tragedia antigua y una edición moderna; un 
escrito extraordinario y un impreso muy ordinario; una historia simple, pero 
un texto difícil. Sería ridículo decir que esta última aseveración atribuye di- 
ficultad no a la obra misma que estoy leyendo ahora —Las Bacantes de 
Eurípides, en la edición de E. R. Dodds— sino a un concepto general bajo 
el cual se la puede clasificar. Pero Frege tiene otra razón para sostener que 
los adjetivos numerales expresan propiedades de conceptos. Imaginemos un 
cuadro estadístico, por países, de los enfermos de cólera diagnosticados en 
1991. Frente al nombre *Perú” el cuadro registra un número de cinco cifras, 
pero frente a “Finlandia” hay un cero. Evidentemente, el cuadro no atribuye 
la propiedad de ser cero al objeto descrito por la frase “enfermo de cólera 
diagnosticado en Finlandia en 1991”. De acuerdo con lo que el propio cua- 
dro nos informa, tal objeto no existe y no puede, por lo tanto, tener propie- 
dad alguna. Pero el cuadro sí podría atribuir dicha propiedad al concepto de 
enfermo de cólera diagnosticado en Finlandia en 1991 y —según la tesis de 
Frege— de hecho se la atribuye.? 


28 He aquí una traducción del pasaje de Frege que he estado parafraseando: 


Si con respecto a un mismo fenómeno externo puedo decir con la misma verdad: 
“esto es un grupo de árboles” y “esto son cinco árboles”, o “aquí hay cinco com- 
pañías” y “aquí hay 500 hombres”, no varía en tales casos ni lo individual, ni el 
todo, el agregado, sino la denominación que le doy. Pero esto indica sólo la sus- 
titución de un concepto por otro. Esto sugiere como respuesta a la primera pre- 
gunta del párrafo anterior [“¿de quién se asevera algo mediante una indicación 
numérica (Zahlangabe)?”] que la indicación numérica contiene un aseveración so- 
bre un concepto. Esto se percibe tal vez con máxima claridad en el caso del nú- 
mero 0. Si digo “Venus tiene O lunas”, no hay ninguna luna o colección de lunas 
de la que pudiera estar diciendo algo; pero le atribuyo una propiedad al concepto 
“luna de Venus”, a saber, la de no comprender nada (nichts unter sich zu befassen). 
Si digo “el coche del emperador va tirado por cuatro caballos” le atribuyo el nú- 
mero cuatro al concepto “caballo que tira el coche del emperador”. 

(Frege 1884, p. 58) 
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Supondré pues, con Frege, que atribuyo cierta propiedad al concepto C 
cuando asevero que los C son un cierto número n. ¿Qué propiedad es ésa? 
Tentativamente, Frege propone la siguiente definición recursiva (1884, p. 67): 


(Aa) Al concepto C le corresponde (zukommt) el número O si y sólo si, 
cualquiera que sea el objeto x, x no es C. 


(AB) Al concepto C le corresponde el número 1 si y sólo si hay un ob- 
jeto a tal que a es C y cualquier objeto b que sea C es idéntico a 
a. 

(Ay) Al concepto C le corresponde el número n + 1 si y sólo si hay un 


objeto a tal que a es C y al concepto C* expresado por la expre- 
sión (insaturada) íx es C y x % a” le corresponde el número n. 


Frege rechaza esta propuesta en el acto, aunque admite que es tan natural 
que el rechazo demanda una explicación. Su principal defecto consiste, se- 
gún él, en que se ha definido la expresión “a C le corresponde el número n 
+ 1” mediante la expresión “a C* le corresponde el número »”, cuyo signifi- 
cado se desconoce. Utilizando las definiciones ofrecidas, 


podemos decir lo que significa (bedeutet) “al concepto F le corresponde 
el número 1 + 1” y luego, mediante este resultado, indicar el sentido (Sinn) 
de la expresión “al concepto F le corresponde el número 1 + 1 + 1”, etc. 
Mas —para dar un ejemplo craso— con nuestras definiciones no podre- 
mos decidir nunca si a un concepto le corresponde el número Julio Cé- 
sar—si el conocido conquistador de Galia es o no es un número. Ade- 
más, no es posible demostrar, con ayuda de las definiciones ensayadas, 
que a tiene que ser igual a b si al concepto F le corresponde el número a 
y a ese mismo concepto le corresponde el número b. Por lo tanto, la ex- 
presión “el número que corresponde al concepto F” no podría justificarse 
y sería, por ende, generalmente imposible demostrar una identidad numé- 
rica, ya que no podríamos captar un determinado número. 

(Frege 1884, p. 68)% 


Como sabemos, el Teorema de la Definición por Inducción de Dedekind 
(Sección 2.3.2 y Apéndice XI) asegura la univocidad de las definiciones 


27 La primera oración de este pasaje muestra que en 1884 Frege todavía utilizaba —como 


en alemán corriente— Bedeutung (“significado”) y Sinn (“sentido”) como sinónimos. 
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recursivas y por lo tanto desarma la objeción general contra tales definicio- 
nes implícita en este texto de Frege. Pero dicho teorema presupone la exis- 
tencia de una serie numérica y no se lo puede invocar para caracterizarla. 
Por otra parte, el texto citado nos sugiere por qué Frege no supo hallar, como 
Dedekind y Peano, una caracterización flexible y viable de los números, y 
dio en cambio con un dogma rígido y contradictorio. Frege no entendió nunca 
que una teoría matemática se interesa por sus objetos sólo en cuanto mantie- 
nen ciertas relaciones mutuas, y no en cuanto a lo que cada uno pudiera ser 
de suyo. Julio César será ciertamente un número, si integra con otros obje- 
tos lo que Dedekind llama un sistema simplemente infinito (para lo cual el 
difunto dictador romano es perfectamente idóneo). Pero a la aritmética no 
va a interesarle su programa político, ni su estilo literario, ni sus hazañas 
militares, sino sólo qué objeto le sigue y qué objetos le preceden en ese sis- 
tema (si él mismo no es el primero). Por eso, en su papel de número nadie 
lo nombraría con su nombre de familia, sino con el numeral correspondiente 
(como hacemos con los dedos, cuando los usamos para sacar cuentas). Inca- 
paz de ver estas cosas que a muchos nos resultan tan obvias, Frege censura 
a Hilbert por modelar el plano euclidiano en un sistema de pares de números 
reales.% La misma ceguera motiva, me parece, su afán de encontrar, para 
cada número natural, un objeto único que se identifique irremplazablemente 
con él. 


sol Hilbert llama Q al sistema de los números algebraicos, esto es, los números reales que 


son soluciones de ecuaciones polinomiales con coeficientes enteros. Frege, 1903b, p. 
374, escribe: 


En la p. 20 [de Hilbert 1899] se dice: “Tomamos como punto un par de números 
(x,y) del dominio (2”, etc. Si mediante la definición y los axiomas pertinentes se 
le hubiese ya conferido una denotación (Bedeutung) a la palabra “punto”, no se 
podría hacerlo aquí otra vez. La cosa hay que pensarla así quizás: el concepto es 
un par de números del dominio O, que es de primer orden, igual que el concepto 
euclidiano de punto, debe caer bajo el concepto hilbertiano de segundo orden (si 
es que hay tal concepto). Molesta, claro está, el uso de la palabra “punto” en ambos 
casos, pues evidentemente tiene en cada uno una denotación diferente. 


El 27 de diciembre de 1899 Frege ya le había objetado por carta a Hilbert que sus 
conceptos de “punto” y “entre” no son unívocos (WB, p. 63). Hilbert le envió a vuelta 
de correo la declaración sobre “el sistema amor, ley, deshollinador, ...” que cité al 
comienzo de la Sección 1.8.1. 
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Inmediatamente después de criticar como hemos visto la definición 
recursiva propuesta, Frege le objeta que ya la base de la recursión (Aa) nos 
dice solamente lo que significa “corresponder (a un concepto) el número 0”, 
mas no lo que el número O es. Esto quiere decir que, en el mejor de los 
casos, la definición determinaría a lo sumo el uso correcto de los adjetivos 
numerales, mas no el significado de los sustantivos numerales que nombran 
a los objetos de la aritmética. Para obviar esta dificultad Frege intenta una 
maniobra familiar en matemáticas. En el lenguaje de hoy, la describiríamos 
sumariamente así: Frege define cierta relación de equivalencia entre pares 
de conceptos e identífica cada número con una de las clases de equivalencia 
determinadas por dicha relación. La equivalencia definida por Frege es la 
relación que hay entre dos conceptos a los que corresponde el mismo núme- 
ro. Espontáneamente, diríamos que un mismo número corresponde a dos 
conceptos F y G si el número n correspondiente a F es idéntico al número 
m correspondiente a G. Pero este camino le estaba vedado a Frege mientras 
no supiera lo que significa la expresión “el número n corresponde al concep- 
to F”. Su magistral ocurrencia consistió en definir la relación diádica *X tie- 
ne el mismo número que Y” sin haber definido aún la propiedad *X tiene un 
cierto número”, y usar la definición de aquella para fijar la de ésta. He aquí 
su definición (Frege 1884, p. 85): 


[Nz] La expresión “el concepto F' es equinumeroso [gleichzahlig] con el 
concepto G” significa lo mismo que la expresión “hay una relación 
$ que coordina biunívocamente [beiderseits eindeutig zuordnet] los 
objetos que caen bajo el concepto F con los objetos que caen bajo 


el concepto G”. 


Para entender esta definición, presuponemos con Frege que, si F es cual- 
quier concepto, los objetos que caen bajo F' forman un colectivo. Siguiendo 
la tradición, Frege lo llama “la extensión (Umfang) de F”. Frege explica que 
una relación (diádica) y coordina un objeto a con otro objeto b si el par 
(a,b) cae bajo el concepto 4. y determina una coordinación biunívoca si 


ds Usando las ideas de Frege 1891, diríamos que q coordina a con b si y sólo si la fun- 


ción q toma el valor v en el argumento (a,b). Como Frege (1884, p. 84) explica 
prolijamente, es enteramente legítimo decir que q coordina los objetos que caen bajo F 
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cumple los dos requisitos siguientes: (1) si el par (a,b,) cae bajo el concepto 
$, entonces (a,b,) cae bajo q sólo si b, = b»; (11) si el par (a¡,b) cae bajo el 
concepto db, entonces (a,,b) cae bajo q sólo si a; = az. Utilizaré la abreviatu- 
ra “F = G” para significar que el concepto FF es equinumeroso con el concep- 
to G. En nuestra jerga actual diríamos pues que, con arreglo a [N¿], F = G 
si y sólo si existe una aplicación biyectiva de la extensión de FF en la exten- 
sión de G. La relación de equinumerosidad es evidentemente una equivalen- 
cia puesto que (1) cada concepto es equinumeroso consigo mismo, (11) si F' = 
G, G=F, y (111) si F = G y G=H, F = H. Como Frege supone tácitamente 
que hay una suerte de reino formado por la totalidad de los conceptos, para 
él es claro que la relación de equinumerosidad determina una partición' de 
ese reino en colecciones de conceptos equinumerosos. Ellas son las clases 
de equivalencia determinadas por la relación. Bajo este supuesto tenemos, 
pues, que en virtud de [N¿] cada concepto F pertenece a una y sólo una de 
esas clases. Ella es la extensión del concepto que expresamos con el predi- 
cado “es equinumeroso con F”. Definimos con Frege (1884, p. 85): 


[Nz] El número correspondiente al concepto F es la extensión del con- 
cepto expresado mediante la fórmula *'X = F”. 
bd La expresión 'n es un número” significa lo mismo que la expresión 


“existe un concepto F tal que n es el número correspondiente a F”. 


Con estas definiciones se habría vindicado finalmente —bajo los supuestos 
indicados— el uso de los numerales como sustantivos. Un numeral nombra 
un número, que según [N¿] es un objeto: la extensión de un concepto. Pero 
también se ha justificado su uso como adjetivos: el concepto cuya extensión 
nombra un cierto numeral se determina fijando uno de los correlatos de una 
relación binaria entre conceptos: la relación de equinumerosidad. Dicho nu- 
meral puede emplearse por eso sin mayor riesgo de confusión para expresar 
la propiedad que pertenece a un concepto cualquiera si y sólo sí es equinu- 
meroso con el correlato fijado. 


con los objetos que caen bajo G —simbólicamente: Vx(Fx > JIy(Gy A qxy))— aunque 
la extensión de F esté vacía. En efecto, si Vx(Fx > x % x), es claro que Vx=Fx, de 
modo que Vx(=Fx v Íy(Gy A Qxy)). La última oración equivale a Vx(Fx > Iy(Gy A 
bxy)). 
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Frege asigna ahora denotaciones precisas a los numerales O y 1: 


[No] 0 es el número correspondiente al concepto expresado mediante la 
fórmula 'x + x”. 
[N] l es el número correspondiente al concepto expresado mediante la 


fórmula íx = 0”. 


La identificación fregeana de los objetos denotados por los demás numerales 
depende esencialmente de la relación binaria que Frege llama seguir inme- 
diatamente en la serie natural de los números. Esta relación se define así 
(Frege 1884, p. 89): 


[No] La oración »n sigue inmediatamente a m en la serie natural de los 
números< (»n folgt in der natiirlichen Zahlenreihe unmittelbar auf 
mx) significa lo mismo que la oración »hay un concepto F y un 
objeto a que cae bajo F, y n es el número correspondiente a F y m 
es el número correspondiente al concepto expresado mediante la fór- 
mula Fx pero x % a'<. 


En vez de 'n sigue inmediatamente a m en la serie natural de números” es- 
cribiré *omn' (léase: 'n sigue inmediatamente a m' o 'n es el siguiente de m?' 
o “m precede inmediatamente a n' o “m es el predecesor inmediato de n”).5? 
Comprobamos en el acto que, conforme a las definiciones de Frege, 1 es en 
efecto el siguiente de O. Según [N;¿], 501 equivale a esta doble generaliza- 
ción existencial: hay un concepto F y un objeto a que cae bajo F, 1 es el 
número correspondiente a F y O es el número correspondiente al concepto 


No escapará al lector que, conforme a [N¿], un número puede ser su propio predecesor 
inmediato. Por ejemplo, si n es el número correspondiente al concepto “punto del cír- 
culo con centro P y radio r” y m es el número correspondiente al concepto “punto ex- 
céntrico del círculo con centro P y radio r”, [N¿] implica que omn aunque m = n (pues 
ambos conceptos son equinumerosos). Por lo tanto, contra lo que parecen creer algu- 
nos traductores, la serie natural de los números, en el sentido de Frege, no es lo mismo 
que la serie de los números naturales, en el sentido corriente. Nuestros números natu- 
rales son lo que Frege (1884, p. 96) llama números finitos, esto es, los números perte- 
necientes a la o-serie iniciada con O (cf. [S3]). Por cierto, un número tal que O <, x, 
satisface la condición —0xx. 
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expresado mediante la fórmula “Fx A x % a”. Dicha generalización existencial 
es verdadera si tiene por lo menos un ejemplo particular. Helo aquí: sea a el 
número 0 y F el concepto que expresamos mediante la fórmula *x = 0”. 1 es 
el número correspondiente a este concepto y O cae bajo el mismo; además 0 
es precisamente el número correspondiente al concepto expresado mediante 
la fórmula 'x=0 1 x%0”. 

Es fácil comprobar que, si cmn, no hay otro número p % n tal que omp: 
si el siguiente de un número existe, es único. La relación binaria o constitu- 
ye pues lo que Frege (1879) llamaba un procedimiento unívoco (véase la 
explicación [S4] en la p. 162). También se comprueba fácilmente que, si omn, 
no hay otro número q + m tal que oqn: si el predecesor inmediato de un 
número existe, es único. Me parece, pues, razonable decir que ces un pro- 
cedimiento biunívoco. Resumo este resultado en una proposición que llama- 
ré F3 para subrayar su homología con el axioma P3 de Peano: 


[F3] Si omn y cpq, entonces m =p <>n=q. 


Nuestras definiciones implican que O no es es el siguiente de ningún núme- 
ro, lo cual se puede enunciar así: 


[F4] No hay un número »m tal que om0. 


Un objeto x es un número finito si y sólo si x es un número perteneciente 
a la o-serie iniciada por O (simbólicamente: Vx(Nxy £ 0 <, x)). Obsérvese 
que esta propiedad es o-hereditaria: VXVY(Nx a oxy > Ny).** 


da En efecto, según [N,], 0m0 implicaría que O es el número correspondiente a un con- 


cepto F bajo el cual cae un objeto a. Tal concepto F' no podría ser equinumeroso con 
el concepto H definido por la condición Hx <> x % x. Mas 0 es, por definición, el 
número correspondiente a un cierto concepto F si y sólo si F = H. 


34 Como d es un procedimiento unívoco, esta aseveración es una consecuencia inmediata 


de Frege 1879, Teorema 131. Pero también podemos justificarla directamente así: Re- 
cordemos las definiciones [S2] y [S3]. Sea m un número finito y n el siguiente de m. 
Por [N,], n es un número. Si0 =.m, 1 =n y es claro que O <¿n, es decir, que n posee 
todas las propiedades c-hereditarias del siguiente de O, puesto que éste es el mismo n. 
Si 0 <,m, m posee todas las propiedades o-hereditarias del siguiente de O y, por cierto, 
se las trasmite a su propio siguiente n, de modo que O <, n. En cualquier caso, O <¿n: 
n es un número finito. 
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Como 0 = 0 > NO, es claro que 
[F1] O es un número finito. 


Como 0 <, x > Nx, tenemos además que (por [S3] y Frege 1879, Teorema 
81, demostrado arriba en la p. 163): 


[F5] Cada número finito posee todas la propiedades c-hereditarias del 0. 


Así pues, la justificación del razonamiento inductivo en aritmética fluye 
directamente de la definición fregeana de número finito. En cambio, la pro- 
posición siguiente es más difícil de probar: 


[F2] Si m es un número finito cualquiera, existe un número finito n tal 
que omn. 


La prueba, meramente esbozada por Frege en 1884, se basa en la simple 
observación siguiente: Si m es un número finito, hay exactamente m núme- 
ros finitos que o-preceden a m. Por lo tanto, si m existe, también existe el 
siguiente de m: éste es el número correspondiente al concepto 'número fini- 
to perteneciente a la o-serie que llega a m' (o sea, “número x tal que, o bien 
0 <,¿x <,m, O bien x =m'). Como Frege (1884, p. 95) nos advierte, esta 
observación presupone que ningún número finito se c-sucede a sí mismo, 
esto es, que Vx(Nx > —(x <, x)).% No puedo detenerme a demostrarlo. 


33 Supongamos, por el contrario, que m <¿m. En tal caso, el concepto “número finito 


perteneciente a la c-serie que llega al predecesor inmediato de m” sería equinumeroso 
con el concepto “número finito perteneciente a la o-serie que llega a m”, y el número 
correspondiente a este último concepto no podría ser el siguiente de »m.. 

La proposición Vx(Nx —> =(x <, x)) es el Lema 52 en Wright 1983, Sección XIX. 
Wright bosqueja una demostración en las pp. 165-67. Ella depende de una definición 
y dos sublemas. Defino con Wright: el concepto F es menos amplio que el concepto G 
(F' < G) si y sólo si hay un concepto A tal que Fr G AH y 3x(Gx a —Hx). (Aquí 'G 
A HP” designa el concepto bajo el cual caen precisamente todos los objetos que caen 
bajo G y bajo H). Los sublemas demostrados por Wright se pueden enunciar así: [521] 
Si u <, v y u es el número correspondiente a un concepto U y v es el número corres- 
pondiente a un concepto V, entonces U < V. [522] Si el número correspondiente al 
concepto F es un número finito, entonces —(F < F) (F no es menos amplio que sí 
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Consideremos, pues, un número finito m. Sea S,, el concepto definido por la 
condición: S,yx <> Nx a x <¿ m. Denotaré con v,, el número correspondiente 
a Sip. Como N es o-hereditaria, es claro que omv,, implica que Nv,, (v,, es 
un número finito). Así, para demostrar [F2] bastaría establecer que cmv,,,. 
Para ello, conviene prestar atención a la propiedad S definida por: Sx si y 
sólo si x es un número finito tal que oxv,. (En otras palabras: el número 
finito x tiene la propiedad S si y sólo sí el siguiente de x es el número co- 
rrespondiente al concepto S,). Si se demuestra (1) que SO y (11) que S es o- 
hereditaria, FS implica que Vx(Nx —> Sx). Es fácil probar (1). En efecto, SO 
<£ vo = 1, esto es, si y sólo si hay un objeto único x tal que Syx. Como es 
imposible que exista un objeto x tal que x <¿0,*” tenemos que Vx(x <¿ 0 > 
x= 0), lo cual implica que 0 es el único objeto que tiene la propiedad So, de 
modo que efectivamente v, = 1. Probar (11) no es tan fácil. Sea m un número 
finito cualquiera. Entonces, Sm <> omv,,. Hay que probar que Sm > Sv,,,. 
Para simplificar la tipografía, pongo v,, = n. Sea p el número correspondien- 
te al concepto T;,, definido por la condición T,x <> S,x nx % mn. En virtud de 
[N,], es claro que opv,,. Como S,x £< Nx an (x=nm v x <¿n), tenemos que 
T,x £ Nx a x <¿n. Por hipótesis, omn. Es claro, entonces, que T,m.* Ha- 
bría que probar, además, que T,x Ax +m > x <¿m.”? Si lo damos por 


mismo). Con los supuestos de Wright es fácil demostrar además que si x es un número 
finito, x es el número correspondiente a algún concepto. Combinados con ella, 521 y 
522 implican que ningún número finito se o-precede a sí mismo. 


37 Sea F la propiedad definida por: Fx si y sólo si hay un concepto G y un objeto u tales 


que Gu y x es el número correspondiente a G. Si w es el siguiente de cualquier núme- 
ro, [N¿] implica que Fw. Así pues, trivialmente, F es una propiedad o-hereditaria. Por 
lo tanto, si u es un número cualquiera, F' es una de las propiedades o-hereditarias del 
siguiente de u. Como obviamente, —FO0, resulta que —(u <¿ 0): O no posee todas las 
propiedades o-hereditarias del siguiente de u. 


dd Según lo que recién hemos visto, T,m <> Nm a m <¿n. Nm por hipótesis y m <¿n si 


y sólo si n tiene todas las propiedades o-hereditarias que posee el siguiente de m. Esta 
es una verdad trivial si, como hemos supuesto, n es justamente el siguiente de m. 


39 T,X Nx %mM—> x<¿m es una consecuencia directa de la conjunción de las dos aseve- 


raciones precedentes con el Lema 5121 de Wright 1983, Sección XIX, cuya demostra- 
ción Wright esboza en las pp. 163-65. Ella depende de la tricotomía de los números 
finitos: VXVY(Nx A Ny > x<¿yY VW x= y V y <¿x) (Lema 51212 de Wright) y de la 
Proposición 124 de Frege 1879: Si f es un procedimiento unívoco y fxy, entonces Vz(y 
<;2 > y Sy z) (Lema 51211 de Wright). 
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hecho, concluimos que T,x +£> x <¿m «O S,,x, de suerte que T,, = S,,. Por 
consiguiente, p = V,, = n y ONV,,. Así queda establecido que Sm —> Sn: S es, 
pues, o-hereditaria. En virtud de (1) y (11), cada número finito m cumple la 
condición Sm y, por ende, hay un número que le sigue inmediatamente en la 
serie natural de los números. 

Así pues, con sólo llenar las lagunas del razonamiento anterior sería po- 
sible deducir los cinco Axiomas de Peano de leyes lógicas suplementadas 
con las definiciones fregeanas [N], [N7], etc. Desgraciadamente, en el siste- 
ma de Frege, estas definiciones sólo pueden enunciarse como tales bajo un 
supuesto que, como sabemos, implica la paradoja de Russell (Capítulo 1.6): 
si F es un concepto bien definido, existe la extensión de F. Arriba vimos 
que este supuesto entra en la definición [N.], y sobre todo en la definición 
[N7], de la que penden la objetividad y unicidad de los números fregeanos. 
En el Apéndice XII explico mejor de qué modo ese supuesto está presente 
en el sistema maduro de Frege, y lo hace contradictorio. Aquí sólo me inte- 
resa destacar que si no hubiera contradicción o si un neo-fregeano pudiera 
eliminarla, los argumentos de Frege establecerían a lo sumo que esas exten- 
siones de conceptos que él llama números finitos forman un modelo de la 
especie de estructura caracterizada por los Axiomas de Peano. Por lo tanto, 


%0 Wright (1983) buscó esquivar la catástrofe reemplazando la definición [N2] por un 


axioma del mismo tenor. Elaborando esta idea, Boolos (1987) muestra que la aritmé- 
tica puede fundarse entera sobre los principios de la lógica de segundo orden de la 
Begriffschrift (Frege 1879) y un solo axioma adicional, que puede parafrasearse así: 
“Para todo concepto F existe un único objeto x tal que, para todo concepto G, x es la 
extensión de F si y sólo si hay una relación q que coordina biunívocamente los objetos 
que caen bajo el concepto F' con los objetos que caen bajo el concepto G”. Boolos 
ofrece además una prueba de consistencia del sistema deductivo así formado, relativa 
a la consistencia de la teoría de conjuntos de Zermelo-Fraenkel (ZF), y también a la 
consistencia del sistema, estrictamente más débil que ZF, que Shoenfield (1967, $ 8.5) 
llama “aritmética de segundo orden”. Ni el axioma de Wright, ni el de Boolos pueden 
pasar por verdades lógicas (Boolos subraya que el suyo, combinado con los susodichos 
principios lógicos, implica la existencia de infinitos objetos; vide Demopoulos 1995, p. 
231). Por este camino no se llega, pues, a vindicar la pretensión de Frege de que la 
matemática es parte de la lógica. Pero sí se pone de manifiesto —como destaca Boolos— 
el enorme logro simplificador y elucidatorio del análisis fregeano del concepto de nú- 
mero, “mediante el cual podemos ver cómo un vasto cuerpo de matemáticas puede 
deducirse de un único principio simple y obviamente consistente” (Boolos 1987, en 
Demopoulos 1995, p. 232). 
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si tales extensiones existieran, podrían legítimamente reclamar el nombre de 
“números”, mas no con mejor derecho que los elementos de cualquier otro 
modelo de esos axiomas. 


2.4 LA TEORÍA DE LOS TIPOS LÓGICOS 


Russell comunicó a Frege en junio de 1902 la paradoja de la clase de todas 
las clases que no son miembros de sí mismas.!' Trabajaba entonces en el li- 
bro The Principles of Mathematics, que apareció en 1903. Aunque lo conci- 
bió —y en buena parte escribió— antes de leer a Frege, la doctrina susten- 
tada en él concuerda en buena medida con la del pensador alemán,? y resul- 
ta igualmente afectada por la paradoja. Las Partes !I—-VII del libro se dedi- 
can a demostrar “que toda la matemática pura se ocupa exclusivamente con 
conceptos definibles en términos de un número muy pequeño de conceptos 
lógicos fundamentales, y que todas sus proposiciones se pueden deducir de 
un número muy pequeño de principios lógicos fundamentales”, mientras que 
la Parte I acomete la “tarea puramente filosófica” de elucidar “los conceptos 


Véase la nota 22 en la p. 143. Es razonable pensar que Russell comunicó la paradoja 
a Frege poco después de descubrirla. Tal era, por ejemplo, la opinión de Coffa (1991, 
p. 114). Pero desde que se sabe que Zermelo descubrió la paradoja independientemen- 
te en 1901 (cf. la nota 3 en la p. 51), los expertos en Russell se han empeñado en 
adelantar la fecha en que éste dio con ella. Rodríguez Consuegra me asegura —en co- 
municación privada— que “fue en 1901, probablemente en mayo, aunque hay quien 
sostiene que en diciembre de 1900”. Por otra parte, según el propio Rodríguez Consuegra 
(1989, p. 134), los pasajes de The Principles que suponen un conocimiento de la para- 
doja —esto es, el Capítulo 10, la versión final del Capítulo 43 y los apéndices sobre 
Frege y sobre la teoría de los tipos— fueron despachados a la imprenta entre junio y 
noviembre de 1902. 


En el Apéndice A del libro citado Russell expone “Las doctrinas lógicas y aritméticas 
de Frege”, según él las veía en 1903, y señala algunas de las diferencias que lo sepa- 
ran de ellas. Tiles 1991, Cap. 3, muestra que, aunque coinciden en la superficie, las 
ideas de Frege y de Russell sobre esta materia responden a motivaciones muy diferen- 
tes. Coffa (1980, pp. 247s.) y otros han destacado que según Russell las verdades arit- 
méticas son sintéticas, mientras que según Frege son analíticas. Pero el pasaje en que 
Russell introduce esta tesis (1903, $ 434) remite a Russell 1900, $ 11, donde se define 
un juicio analítico como “aquel cuyo predicado está contenido en el sujeto”, noción 
ésta francamente más estrecha que la de Frege, para quien, como sabemos, una aseve- 
ración es analítica cuando se deduce de definiciones y las leyes de la lógica (cf. p. 
130, nota 4). 
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fundamentales que la matemática acepta como indefinibles” (Russell 1903, 
Prefacio; 2* ed., 1937, p. xv). La paradoja es el tema del capítulo 10, “The 
Contradiction”. En ese mismo capítulo y en el Apéndice B, Russell esboza 
un método para resolverla. Se trata de la primera versión, todavía rudimen- 
taria, de la teoría de los tipos lógicos adoptada en Principia Mathematica 
(1910-13), la obra monumental que Russell escribe en colaboración con 
Whitehead. En el citado Prefacio, Russell en cierto modo anuncia esta obra 
al declarar que lo que en 1903 ofrece al público es sólo un primer tomo, 
escrito informalmente en inglés y dirigido principalmente a los filósofos, y 
que irá seguido de un segundo tomo, formal, en escritura conceptual, para 
cuya redacción ha reclutado la ayuda del matemático Whitehead. Pero los 
tres tomos que finalmente escribieron juntos se alejan bastante del libro de 
1903 y no se presentan como una continuación suya. 

No pretendo examinar aquí la filosofía matemática de Russell.2 Menos aún 
puedo evaluar en este espacio el aporte de Whitehead y Russell a un mejor 
entendimiento de la arquitectura de la matemática clásica y su influencia 
efectiva en el desarrollo ulterior de la misma.* Me limitaré a hablar de la 
teoría de los tipos, que es seguramente —después de la paradoja— la contri- 
bución más original y característica de Russell a nuestro tema. Quizás sería 
mejor considerarla no como una teoría —descripción o explicación de algún 
género de realidades— sino como una preceptiva gramatical, dirigida a im- 
pedir que se escriban expresiones capaces de generar contradicciones como 
la paradoja de Russell. Pero sólo mucho más tarde —respondiendo a la crítica 


Russell mismo la explica admirablemente en su forma madura en Introduction to Mathe- 
matical Philosophy (1919), de la que hay varias traducciones al castellano. El lector 
interesado en sus comienzos, antecedentes y motivaciones puede ahora recurrir al ex- 
celente libro de Rodríguez Consuegra (1991). 


Sospecho que, salvo por la saludable costumbre de formular las proposiciones y razona- 
mientos matemáticos en un fragmento del lenguaje “natural” (castellano, inglés, etc.) 
que se deje traducir sin pérdida a un cálculo predicativo de primer o segundo orden, 
dicha influencia ha sido insignificante. Para confirmar o refutar esta sospecha sería 
menester, eso sí, poner en claro como se entienden a la luz de Principia Mathematica 
las grandes teorías de la matemática clásica (para determinar, luego, el papel que ese 
particular modo de entenderlas ha desempeñado en el desarrollo ulterior de las mis- 
mas). Los tres estudios más notables sobre la obra de Whitehead y Russell —Ramsey 
1925, Quine 1941 y Gódel 1944— dejaron inexplorado este tema y no conozco ningún 
trabajo que lo aborde. 
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de Black (en Schilpp 1944)— aceptará Russell verla así (Schilpp 1944, p. 691). 
La versión publicada en el tomo | de Principia Mathematica en 1910 es el fruto 
de una meditación compleja y vacilante, atenta a preocupaciones metafísicas, y 
ello se le nota. En lo que sigue trazaré a grandes rasgos su desarrollo.* 

A la teoría cantoriana del transfinito se le imputaban dos paradojas que 
algunos juzgaban fatales: (1) La paradoja de Cantor: el cardinal del con- 
junto de todos los conjuntos tiene que ser mayor que cualquier otro cardinal 
pero, según el Teorema de Cantor, es menor que el cardinal del conjunto de 
las partes del conjunto de todos los conjuntos. (ii) La paradoja llamada de 
Burali-Forti: el conjunto de los ordinales está bien ordenado y por lo tanto 
tiene un ordinal, mayor que cualquier ordinal perteneciente a dicho conjun- 
to, el cual, por ser un ordinal, pertenece sin embargo a ese conjunto. La 
paradoja de Russell, inspirada por la demostración del Teorema de Cantor 
(Capítulo 1.6), se deja insertar en este mismo orden de ideas, si entendemos, 
con Russell (1903, $ 68), que las clases a que se refiere la paradoja son 
precisamente los objetos que en la jerga matemática se llaman conjuntos. Se 
distingue, empero, de las dos paradojas citadas en cuanto no envuelve los 
conceptos de cardinal u ordinal ni ningún otro concepto específicamente 
matemático, de modo que es propiamente una paradoja de la lógica univer- 
sal, no de una disciplina matemática particular. En su primer intento de re- 
solverla, Russell apela al distingo — introducido en Russell 1903, Cap. VI— 
entre una clase considerada como pluralidad de objetos (the class as many) 
y una clase considerada como siendo ella misma un objeto (the class as one). 
Damos por descontado —dice Russell — que dondequiera hay una clase-plu- 
ralidad también hay una clase-objeto, pero este axioma no tiene que valer 
universalmente y parecería ser la fuente de la contradicción. “Así pues, con 
sólo negarlo se superará toda la dificultad” (1903, $ 104).* 


Cocchiarella (1980) contiene un análisis más detallado de la compleja evolución de la 
teoría de los tipos desde 1903 hasta 1910 y explica su curiosa motivación filosófica. 
Rodríguez Consuegra (1989) ilumina el proceso con la luz que emana de los inéditos 
de Russell y de paso corrige algunas opiniones de Cocchiarella. 


El distingo russelliano entre the class as one (literalmente, “clase como uno”) and the 
class as many (clase como muchos”) es afín al distingo entre referencia distributiva y 
colectiva que utilicé en el Capítulo 1.1. Sea k un sustantivo común o frase sustantiva 
que especifica una clase. Entonces, podemos referirnos distributivamente a cualquier k 
(any k) o a cada k (every k) y también podemos referirnos colectivamente a todos los 
k (all k). Este último modo de referencia englobaría a los k en una unidad objetiva, the 
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Como veremos, Russell luego descartará esta solución, debido a la impo- 
sibilidad de fijar un criterio racionalmente justificable que determine los casos 
en que a una clase-pluralidad le corresponde una clase-objeto y los casos en 
que no le corresponde. Al parecer fue buscando ese criterio que Russell dio 
con la idea de tipo lógico, conservada luego en la solución que adopta final- 
mente. Para Russell el concepto de clase está estrechamente ligado al con- 
cepto de función proposicional, que explica así: “fx es una función 
proposicional si, para cada valor de x, (x es una proposición, bien determi- 
nada si x está dado” (1903, $ 22). “Una clase puede definirse como todos 
los términos que satisfacen una cierta función proposicional” ($ 23). En el 
vocabulario de Russell 1903, un “término” (term) no es una palabra o frase 
de cierto género, sino “cualquier cosa que pueda ser objeto del pensamiento 
. . . 0 pueda ser contada como una” ($ 47). Así pues, la clase correspondiente 
a la función proposicional px comprende un objeto u si y sólo si Qu es una 
proposición verdadera. Ahora bien, según Russell 


cada función proposicional px... posee además de su ámbito de verdad 
(range of truth), un ámbito de significación (range of significance), esto 
es, un ámbito dentro del cual x debe hallarse si dx ha de ser una proposi- 
ción, ya sea verdadera o falsa. Los ámbitos de significación forman tipos, 
esto es, si x pertenece al ámbito de significación de (px, existe una clase 
de objetos, el tipo de x, todos los cuales también tienen que pertenecer al 
ámbito de significación de qx, como quiera que varíe q; y el ámbito de 
significación es siempre, o bien un tipo único, o una suma de varios tipos 
completos. 

(Russell 1903, $ 497) 


Las seis apretadas páginas que Russell dedica a “La doctrina de los tipos” 
(1903, Apéndice B) no son un dechado de claridad,” pero es bastante claro 


class as one, la clase-objeto. Pero no toda expresión especificadora k tiene esta virtud. 
Así, si k es la frase sustantiva “clase que no es miembro de sí misma”, la paradoja de 
Russell implica que no puede existir la clase-objeto de todas las k. Pero —contra lo 
que Russell va a sostener más tarde— ello no nos impediría hablar con sentido de una 
k, cualquier k, cada k. 

Especialmente desconcertante es la relación que establece Russell aquí entre su inci- 
piente doctrina de los tipos y el par de conceptos clase-como-muchos/clase-como-uno. 
Según él, una clase-como-uno es un objeto del mismo tipo que los comprendidos en 
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cómo piensa utilizarla para resolver su paradoja: si el ámbito de significa- 
ción de una función proposicional dx comprende objetos de un tipo dado, 
entonces su ámbito de verdad —es decir, la clase de los objetos u tales que 
Qu es una proposición verdadera— es un objeto de otro tipo diferente. Por 
lo tanto, si esta clase es designada por la expresión “fu: fuy”, la expresión 
“pLu: du)” carece de sentido, puesto que (u: du) no pertenece al ámbito de 
significación de qx. Así pues, en el contexto de la doctrina de los tipos, no 
tiene cabida la noción de que una clase esté o no esté comprendida dentro 
de sí misma y la paradoja de Russell no se puede siquiera expresar. Las 
paradojas de Cantor y Burali-Forti también se eliminan por esta vía. 
Russell (1906) retorna al tema de las paradojas, comentando un artículo 
del matemático Hobson. Éste daba por supuesto que un “agregado” (ag- 
gregate) —hoy diríamos un conjunto— de objetos sólo puede constituirse si 
hay una norma que lo defina, esto es, una condición determinada que cum- 
plan todos sus elementos y sólo sus elementos (Russell aclara que lo que 
Hobson llama una norma es lo mismo que él llama una función propo- 
sicional).9 Por eso, Hobson cuestiona el Axioma de Selección adoptado por 
Zermelo (1904) para demostrar el Teorema del Buen Orden. Según este axio- 
ma, si Y es una familia de conjuntos no vacíos, existe un conjunto que con- 


ella: “Lo que llamamos en el Capítulo VI la clase-como-uno es un individuo, con tal 
que sus miembros sean individuos: los objetos de la vida diaria, personas, mesas, si- 
llas, manzanas, etc., son clases-como-uno” (1903, $ 497). Al tipo superior siguiente 
pertenece en cambio la respectiva clase-como-muchos. Aparentemente, Russell identi- 
fica aquí la clase-como-uno que forman ciertos objetos con lo que llamaríamos hoy la 
fusión o suma mereológica de esos objetos (su relación con ellos es como la que tiene 
una barra de acero con los átomos de hierro y carbono de que consta). En cambio, la 
clase-como-muchos, en abierto contraste con la caracterización original de este con- 
cepto en el Capítulo VI, es tratada aquí como un objeto, de otro tipo que sus miem- 
bros, sí, pero dotado de unidad y susceptible de agruparse con otros de su mismo tipo 
para formar nuevas clases (como-uno y como-muchos). 


Esta identificación me parece demasiado optimista: las normas de Hobson son oracio- 
nes del inglés o de otro idioma, de las que hay ejemplos por docenas en cualquier libro 
de matemáticas; en cambio, las funciones proposicionales de Russell, que son aplica- 
ciones del reino de los objetos en el reino de las proposiciones, son —como este últi- 
mo— criaturas de su rica inventiva metafísica, cuya misma naturaleza cambia de uno 
a otro de sus escritos. Más exacto sería decir, pues, que lo que Hobson llama “norma” 
es lo que Russell intentaba “reconstruir racionalmente” mediante su concepto de fun- 
ción proposicional. 
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tiene precisamente un elemento de cada elemento de %, aunque no hay nin- 
guna norma que lo defina. Hobson parece haber pensado asímismo que las 
paradojas de la teoría de conjuntos nacen de la ausencia o imperfecta espe- 
cificación de una norma, pero, como Russell hace ver, la situación en este 
caso es muy diferente: 


La dificultad de los agregados inconsistentes surge de la presencia de una 
norma perfectamente bien definida combinada con la ausencia demostrable 
del agregado correspondiente. Esto sugiere que una norma es una condi- 
ción necesaria pero no suficiente para la existencia de un agregado; de 
ser así, la solución completa de [la dificultad de los agregados inconsis- 
tentes] estribaría en descubrir las condiciones precisas que una norma debe 
cumplir para definir un agregado. 

(Russell EA, p. 136) 


Russell señala que la palabra “agregado” se usa a veces de un modo que 
implica la existencia de un orden, y que él utilizará “clase” (class) para refe- 
rirse a un agregado sin tal implicación. Si toda norma lógicamente bien de- 
terminada definiera una clase, entonces existiría la clase W formada por todos 
los entes x que cumplen la norma 'x = x”. Como todo ente cumple esa nor- 
ma, no puede haber un cardinal mayor que ['Wl, el cardinal de la clase W. 
Pero Cantor ha demostrado que, si W' existe, I'WI < I2'W1. Por lo tanto, la 
norma 'x = x” no determina una clase. Análogamente, si la norma *x no es 
una clase que sea un miembro de sí misma” definiera una clase w, tendría- 
mos que w es un miembro de sí misma si y sólo si no lo es. Por lo tanto, 
tampoco esta norma define una clase. De este modo, “aparte de toda opinión 
sobre la naturaleza de los cardinales y sin hacer consideraciones perte- 
necientes a la aritmética, podemos probar que hay al menos una norma 
perfectamente determinada que no define una clase” (EA, p. 139). Russell 
llama no-predicativas (non-predicative) a las normas (funciones propo- 
sicionales) de una variable que no definen clases, y predicativas (predicative) 
a aquéllas que sí las definen; análogamente, una función proposicional de 
dos variables se llama predicativa si define una relación binaria, no-predicativa 
si no la define, etc. “Necesitamos, pues, reglas para decidir cuáles normas 
son predicativas y cuáles no lo son, a menos que adoptemos la opinión (que, 
como veremos, es muy recomendable) de que ninguna norma es predicativa” 


(p. 141). 
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Russell bosqueja tres soluciones posibles de este problema, que bautiza 
(a) la teoría del zigzag, (b) la teoría de la limitación de tamaño y (c) la teo- 
ría sin clases (the no classes theory). La teoría del zigzag supone que si px 
es una función predicativa, también su negación —¿Qx es predicativa.? Sea 
yx una función no-predicativa. Entonces, no existe una clase Lx: yx). Por lo 
tanto, cualquiera que sea la función predicativa qx, el ámbito de verdad de 
yx zigzagueará entre la clase (Lx: dx) definida por ella y la clase Lx: —(Qx) 
definida por su negación. Según Russell, esta es la teoría sugerida en 
Principles of Mathematics, $$ 103 y 104 (EA, p. 146n.). Su desarrollo cabal 
requiere axiomas que establezcan qué funciones son predicativas. Se parte 
de la base que todas las funciones proposicionales simples son predicativas 
y sólo algunas complicadas y extrañas no lo son. Pero, según Russell, cuan- 
do intentó precisar esta idea básica tuvo que formular axiomas excesivamen- 
te complicados y carentes de toda plausibilidad intrínseca. Además, para 
seleccionarlos no tuvo otra guía que la necesidad de evitar contradicciones, la 
cual “por sí sola, es un principio muy insuficiente, pues nos deja expuestos siem- 
pre al riesgo de que nuevas inferencias generen contradicciones” (EA, p. 147). 

Russell atribuye la teoría de la limitación de tamaño a su amigo el ma- 
temático Philip Jourdain. Según ella una función proposicional define una 
clase no cuando su fórmula es suficientemente sencilla, sino cuando efecti- 
vamente deslinda una colección de objetos, y no implica —como las funcio- 
nes íx es un cardinal” y “x es un ordinal? — que todo límite que se designe 
será rebasado. Desde este punto de vista, obviamente, si fx es predicativa, 
=(Qx no puede serlo. Russell opina que “una gran dificultad de esta teoría 
consiste en que no nos dice hasta dónde es legítimo avanzar en la serie de 
los ordinales. Pudiera ser que ya () sea ilegítimo, en cuyo caso todas las 
clases propiamente tales (all proper classes) serían finitas” (EA, p. 153). 


Uso aquí la notación de Russell 1903. Russell 1906 designa una función proposicional 
cualquiera, predicativa o no, con una expresión formada por una minúscula griega se- 
guida de un signo de admiración y una minúscula latina cursiva, vgr. q!x. Pero en 
Principia Mathematica el signo de admiración a la derecha de una minúscula griega 
distingue a cierto género de funciones (llamadas “predicativas”, pero en una nueva 
acepción que explico en la nota 20). Para no turbar al lector con tantas notaciones 
incompatibles, me abstengo de emplear la de Russell 1906. 


Obsérvese que, como Russell equipara sus clases a lo que los matemáticos llaman con- 
juntos, tiene que llamar clases propias a lo que los matemáticos —desde von 


2.4 La teoría de los tipos lógicos 184 


En 1906, todas las simpatías de Russell van a la teoría sin clases. El es- 
crito que comentamos concluye con una nota suplementaria, fechada el 6 de 
febrero de 1906, en la que dice que sus últimas investigaciones lo han per- 
suadido de que la teoría sin clases proporciona “la completa solución” de las 
dificultades suscitadas por las paradojas (EA, p. 164). Se refiere, sin duda, a 
los resultados que presenta en su artículo “Sobre la teoría sustitucional de 
las clases y las relaciones” (1906a), sometido a la London Mathematical 
Society el 24 de abril de 1906, pero retirado antes de que saliera impreso, 
porque dejó de satisfacerlo (se publicó póstumamente en 1973). El nombre 
“teoría sustitucional” alude al método de sustitución de expresiones con que 
propone eliminar —o hacer ontológicamente inocuos— los ingredientes del 
lenguaje que aparentemente hacen referencia a las clases.!! Dicho método le 
fue sugerido seguramente por su brillante análisis de las descripciones defi- 
nidas (Russell 1905), que paso a explicar. 

Afligido por la dificultad de asignar una denotación a expresiones tales 
como “la esposa favorita del obispo de Roma” o “el río de oro derretido que 
desemboca en el Orinoco”, que describen algo que no existe, Russell optó 
por concebirlas como abreviaturas que sirven para representar en contextos 
de un cierto género a otras expresiones más largas, las cuales, a su vez, no 
denotan nada. Concretamente, cuando se dice que 


(1) El río de oro derretido que desemboca en el Orinoco es más cauda- 
loso que el Guadalquivir 


lo que se expresa, según Russell, es simplemente que 


Neumann— llaman clases impropias (propias son precisamente las clases que no son 
conjuntos). Recordemos de paso que —como se vio en la Sección 1.8.4— la teoría de 
conjuntos de von Neumann da una respuesta precisa a la dificultad mencionada por 
Russell: una clase es “demasiado grande” —y por lo tanto es propia en el sentido de 
von Neumann, impropia en el sentido de Russell — si y sólo si es equinumerosa con la 
clase de todos los conjuntos. 


Como Russell abandona muy pronto la teoría de 1906a pero sigue simpatizando con la 
idea de la eliminación de las clases, los expertos distinguen entre la “teoría sin clases” 
y la “teoría sustitucional de las clases”. Pero, comparando textos, no hay duda de que 
la “teoría sin clases” bosquejada en Russell 1906 (EA, pp. 154-56) y aludida en la nota 
suplementaria al final (EA, p. 164), no es otra que la teoría sustitucional explicada en 
1906a. 
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a+) Existe un objeto x tal que (1) x es un río de oro derretido que desem- 
boca en el Orinoco, (11) x es más caudaloso que el Guadalquivir y 
(111) si cualquier objeto y es un río de oro derretido que desemboca 
en el Orinoco, entonces y es idéntico a x. 


En (1%), la descripción del río de oro figura sólo como predicado, no como 
frase nominal. La oración es falsa porque no hay nada que satisfaga ese 
predicado, y no, como sugiere (1), porque el objeto denotado por la frase 
nominal sea un río no más caudaloso que el Guadalquivir. 

No es raro que Russell, después de eliminar con tanta soltura la denotación 
de las descripciones definidas, se sintiera animado a hacer lo propio con los 
nombres de clases. Se trata “de proveer un modo de interpretar las asevera- 
ciones corrientes sobre clases sin suponer que las clases son entes” (1906c, 
p. 200). Por esta vía, resultará que todas las proposiciones significativas en 
que se mencionan clases pueden entenderse como proposiciones acerca de 
sus miembros, esto es, sobre algunos o todos los objetos que satisfacen cier- 
ta función proposicional px. Sólo las proposiciones que no se dejan entender 
así dan lugar a contradicciones. “Por lo tanto, es natural suponer que las clases 
son meramente abreviaturas lingúísticas o simbólicas” (Ibid.). Russell reco- 
noce que el procedimiento de eliminación propuesto por él es complicado, 
un truco técnico que debe reemplazarse por otro más conveniente. Las si- 
guientes indicaciones, basadas en su primera presentación sumaria de la teo- 
ría (Russell 1906, en EA, pp. 154-56), darán una idea de lo que se trata. 

Sea p una proposición y p(x/a) lo que se obtiene cuando x reemplaza a a 
en todos los lugares en que a figura en p; p(x/a) nos da, para distintos valo- 
res de x lo que solíamos llamar los distintos valores de una función propo- 
sicional.'? Si b es un ente cualquiera que no es un ingrediente de p y q = 
p(b/a), tenemos que la aseveración “q(x/b) es verdadera para todo valor de x” 


Ñ Lo anterior traduce literalmente palabras de Russell. No pretendo que sean claras. Como 
una proposición es un estado de cosas —real o posible— la letra a designa aquí un 
ingrediente objetivo del mismo. La variable x, en cambio, no puede sino ser un objeto 
lingúíístico: un pronombre si está ligada, la indicación de un “hueco” (en el sentido de 
Frege) si está libre ¿Cómo se puede reemplazar un ingrediente objetivo de un estado 
de cosas con un “hueco”? ¿Cuál es el modo de ser del producto de tal procedimiento? 
Incapaz de responder a estas preguntas, las tomo como un indicio más de la confusión 
que, en diversas modalidades, acompañó a Russell durante casi toda su carrera filosó- 
fica. 
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equivale a “p(x/a) es verdadera para todo valor de x”. Cabe, pues, decir que 
la aseveración “p(x/a) es verdadera para todo valor de x” no depende del sujeto 
a, sino “sólo de la forma de p” (EA, p. 155). Russell propone que usemos 
aseveraciones de este tipo en vez de mencionar funciones proposicionales o 
clases determinadas por ellas. 


Por ejemplo, en vez de “p es una función unitaria” (esto es, “Hay un y 
sólo un x tal que qx es verdad”), tendremos “Hay un ente b tal que p(x/a) 
es verdadera si y sólo si x es idéntico a b”. No existirá ya, pues, un ente 
como el número 1, aislado; pero podremos definir lo que significamos al 
decir “Una y sólo una proposición del tipo p(x/a) es verdadera (dados p y 
a)”. En vez de decir “La clase u es una clase que tiene sólo un miembro”, 
diremos [ ... ] “Hay un ente b tal que p(x/a) es verdadera si y sólo si x es 
idéntico a b”. Aquí los valores de x para los cuales p(x/a) es verdadera 
reemplazan a la clase u; pero no presuponemos que estos valores forman 
colectivamente un ente único que es la clase compuesta de ellos. 
(Russell EA, p. 155)'* 


Russell observa que no es difícil reemplazar la antigua escritura por la nue- 
va, pero que la demostración de teoremas de existencia se ve entonces muy 
entorpecida. En 1906 esperaba “elaborar esta teoría hasta el punto en que se 
vea claramente cuánto preserva de las matemáticas y cuánto nos fuerza a 
abandonar” (EA, p. 156). Como “clases” y “conjuntos” (“agregados”) son para 
Russell lo mismo, la negación de la existencia de tales entes imprime a su 
filosofía de las matemáticas un rumbo muy distinto del que tomó por esos 
mismos años la filosofía de los matemáticos. Como vimos en el Capítulo 
1.7, Zermelo (1908a) postula la existencia de un mínimo de conjuntos que 
le parecían imprescindibles para hacer matemáticas, y presume que su teoría 
es inocente de contradicciones mientras no se la pruebe culpable.'* La co- 


Como advertí en la nota 9, altero un poco la notación de Russell: él escribe q!x donde 
yo qx. También Lackey, el editor de EA, se ha tomado libertades con la notación ori- 
ginal: Russell ponía el “numerador” sobre el “denominador” en la “fracción” x/a, con 
lo cual podía prescindir de los paréntesis que Lackey y yo utilizamos para separarla de 
la p. Curiosamente, después de reformar esta notación de Russell en el texto de 1906, 
Lackey se ciñe fielmente a ella en el texto de 1906c (el original inglés de 1906b). 

Subrayo que los axiomas de Zermelo no se eligen, como en la teoría russelliana del 
zigzag, sólo con vistas a prevenir las contradicciones conocidas. Zermelo tiene un co- 
metido —hacer matemáticas— y postula lo que necesita para eso. Su selección se ha 
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rriente central de la matemática conjuntista ha seguido su ejemplo con una 
temeridad que aterra a los temperamentos metafísicos, ansiosos de cobijarse 
en una verdad totalitaria e inquebrantable. 

Whitehead y Russell declaran reiteradamente que el sistema de Principia 
Mathematica es neutral con respecto a las clases: no presupone su existencia 
ni su inexistencia (PM, I, 24, 187). Pero la escritura conceptual utilizada en 
el libro no cuenta con los medios para nombrar tales objetos; una expresión 
como X(px)—que se lee “la clase de los objetos x que satisfacen la condi- 
ción q”— simula hacerlo, pero es un símbolo incompleto, definido siguien- 
do un patrón análogo al arriba descrito (véase la definición contextual de 
“£(bx)” en la nota 35). Es verdad que en Principia Mathematica la elimina- 
ción de las clases no lleva la voz cantante en la solución de las paradojas;!* 
pero opera tras bastidores. La solución se funda expresamente en el “princi- 
pio del círculo vicioso”, que Russell (1906b, 1908) toma de Poincaré. Pero 
dicho principio es insostenible si de veras hay clases (véase la nota 41 y el 
texto que remite a ella). 

Henri Poincaré, matemático profundo y agudo filósofo, no simpatizaba con 
el “cantorismo” (como llamaba a la teoría de conjuntos) y menos aún con la 
“logística” (esto es, la nueva lógica premunida de escritura conceptual y ávida 
de anexarse las matemáticas). El fenómeno de las paradojas le parece una 
señal clarísima de que cantoristas y logísticos andan perdidos. En el segun- 
do de tres artículos sobre “Las matemáticas y la lógica” (1905/1906),!* 
Poincaré introduce el tema con marcado sarcasmo: 


probado duradera. En cambio, Russell, que buscaba certificar —como si hiciera fal- 
ta— las matemáticas hechas por otros, daba solamente con axiomas implausibles, ins- 
pirados por un principio que él mismo juzgaba insuficiente (1906, en EA, p. 147, cita- 
do arriba en la p. 183). 

Esto puede deberse a que Whitehead no favorecía la eliminación de las clases. El 22 
de febrero de 1906 —o sea, dos semanas después de la fecha de la nota suplementaria 
en que Russell abraza sin reservas esa alternativa— Whitehead le escribió protestando 
contra su teoría sustitucional, que “funda toda la matemática en un artificio tipográfico 
(a typographical device) y de este modo contradice las doctrinas principales del tomo 
IT [= Russell 1903]” (citado por Lackey en Russell, EA, p. 131; cf. las otras citas y 
comentarios de Lackey en las pp. 131-32). 


Una versión revisada de estos ensayos forma los Capítulos II, IV y V del libro II de 
Science et méthode (Poincaré 1908). A ella remiten mis referencias. 
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¿Pueden las matemáticas ser reducidas a la lógica sin recurrir a principios 
que le sean propios? Existe una escuela llena de ardor y de fe que se 
esfuerza por establecerlo. Tiene un lenguaje especial en el que las pala- 
bras se sustituyen por signos. Este lenguaje no lo comprenden más que 
algunos iniciados, de manera que los profanos están dispuestos a inclinar- 
se ante las decisivas afirmaciones de los adeptos. No me parece inútil 
examinar estas afirmaciones más de cerca a fin de ver si justifican el tono 
perentorio con que se las presenta. 

(Poincaré, CM, p. 111)” 


Poincaré reúne bajo el nombre de antinomias!? cantorianas las paradojas 
que hemos mencionado ya, en las que figura decisivamente la noción de 
conjunto o la de clase, con otras que aún no hemos mencionado, en que estas 
nociones no desempeñan ningún papel. Tiende un puente entre ambos gru- 
pos la paradoja de Richard (1905), en la cual figura la noción de conjunto, 
pero de modo inesencial. Hela aquí: sea E el conjunto de los números reales 
del intervalo (0,1) que se pueden caracterizar en nuestro idioma mediante un 
número finito de palabras. E es evidentemente un conjunto numerable. Sea 
f: N = E una enumeración de E. Designemos con al;, al k-ésimo dígito de 
la expansión decimal infinita de f(h) e E. Caracterizaré ahora un número 
real f del intervalo (0,1) mediante la condición siguiente: Sea f,, el n-ésimo 
dígito de la expansión decimal infinita de (3; entonces P, =53 si a, +5 y P, 
= 6 si 0, = 5. Evidentemente, PB £ E, puesto que, para cada n e N, f difie- 
re de f(n) en el n-ésimo dígito de la respectiva expansión decimal infinita. 
Más, por otra parte, es claro que fe E, puesto que acabamos de caracterizarlo 
en castellano mediante un número finito de palabras. El argumento de Richard 


Cf. también este otro pasaje, referente a la paradoja de Burali-Forti: “Mientras se trate 
de demostrar que uno es un número, la pasigrafía basta; pero si se presenta una difi- 
cultad, si hay una antinomia que resolver, la pasigrafía se torna impotente” (Poincaré, 
CM, p. 123). “Pasigrafía” —esto es, “escritura para todos” (o “para todo”) — es el nom- 
bre que daba Peano a su escritura conceptual. 

“Antinomia' —es decir, antilegalidad— llamó Kant al “conflicto de la razón pura con- 
sigo misma” que estudia en su Crítica de la razón pura. Dicho conflicto se manifiesta, 
según Kant, en la demostración de varios pares de aseveraciones contradictorias. Con- 
forme a un precedente establecido por el propio Kant, la palabra “antinomia' se usa 
comúnmente para designar a cada uno de estos pares. Por ejemplo, la segunda antino- 
mia kantiana consta de la tesis, “Todo cuerpo consta de partes indivisibles” y la antí- 
tesis, “Todo cuerpo es indefinidamente divisible”. 
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apela, es cierto, a la noción de conjunto y se vale una vez más del método 
diagonal de Cantor para generar una contradicción, pero se puede formular 
una paradoja esencialmente análoga a ésta sin esos recursos. Poincaré (CM, 
p. 144) cita la siguiente paradoja que atribuye Russell, pero que según éste 
le fue sugerida por G. G. Berry (Russell LK, p. 60n.). Considérese el entero 
positivo más pequeño que no se puede describir en castellano con menos de 
diechiocho palabras. Como, obviamente, hay enteros positivos que sólo pue- 
den describirse con 18 palabras o más, tiene que haber uno entre ellos — 
llamémosle a— que sea menor que todos los demás. Según esto, a. no pue- 
de describirse con menos de 18 palabras. Sin embargo, la frase en cursiva lo 
describe inequívocamente, y tiene sólo 17 palabras. Como se puede ver, la 
contradicción no incide en una relación como la simbolizada con “e”, que 
podemos pensar que subsiste en virtud de la propia naturaleza de las cosas 
relacionadas, sino en la relación obviamente convencional entre un término 
y la expresión que lo define. Este giro lingilístico se advertía ya en la prime- 
ra formulación de la paradoja de Russell en la carta que éste escribió a Frege 
el 16 de junio de 1902: “Sea w el predicado “es un predicado que no puede 
predicarse de sí mismo” ¿Se puede acaso predicar w de sí mismo? De cada 
respuesta se infiere lo contrario” (Frege, WB, p. 211; vide supra, p. 143, 
nota 22).!” 

Según Poincaré, Richard (1905) ofrece la verdadera solución de las 
“antinomias cantorianas”. Consideremos una vez más el conjunto E, men- 


e Al mismo género pertenece la siguiente paradoja publicada en Russell 1903, Apéndice 
B, $ 500: Sea m una clase de proposiciones; la proposición “todas las proposiciones de 
la clase m son verdaderas” puede o no pertenecer a la clase m; sea w la clase de todas 
las proposiciones de la forma indicada que no pertenecen a la clase que mencionan y 
sea p la proposición “todas las proposiciones de la clase w son verdaderas”; entonces p 
pertenece a w si y sólo si no pertenece a w. Russell señala allí que esta paradoja no 
puede resolverse con la teoría de los tipos (simple, no ramificada) propuesta en dicho 
Apéndice B. 

El giro lingúístico se consuma en la siguiente paradoja, descubierta por Kurt Grelling: 
digamos que una palabra es autológica si tiene la propiedad que ella expresa o perte- 
nece a la clase que ella nombra, heterológica en caso contrario. Por ejemplo, “breve”, 
“pentasílaba”, “esdrújula” y “sustantivo” son palabras autológicas, “larga”, “tetrasílaba”, 
“aguda” y “adverbio” son heterológicas. Ahora bien, la palabra “heterológica” ¿es 
heterológica o autológica? Evidentemente, si es heterológica es autológica y si es 
autológica es heterológica (Grelling y Nelson 1908). 
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cionado en la presentación de la paradoja debida a este autor. £ es el con- 
junto de los números reales del intervalo (0,1) que se pueden caracterizar en 
nuestro idioma mediante un número finito de palabras sin hacer referencia 
al conjunto E. La cláusula en cursiva tiene que subentenderse en la defini- 
ción de £ pues de otro modo dicha definición contendría un círculo vicioso. 
“No se puede definir E por el conjunto E mismo” (Poincaré, CM, p. 146). 
Pero entonces no hay duda que PB £ £ y que es falsa la conclusión antinómica 
P e E. En efecto, aunque el número f se ha definido con un número finito 
de palabras, esas palabras contienen una referencia a E. Según Poincaré, “la 
misma explicación vale para las otras antinomias, como es fácil verificar” 
(pp. 146ss.). De este modo, habríamos por fin hallado el criterio —que Russell 
(1906) decía haber buscado en vano— para distinguir las definiciones (nor- 
mas, funciones proposicionales) predicativas de las que no lo son: “Las de- 
finiciones que deben ser consideradas como no predicativas son las que 
contienen un círculo vicioso” (Poincaré, CM, p. 147). Aquí “predicativa” 
designa —siguiendo a Russell (1906)— las definiciones que determinan una 
clase. Sin embargo, el texto recién citado de Poincaré —en cursiva también 
en el original — se entenderá más tarde como una definición de los términos 
técnicos *predicativo” y “no predicativo” o “impredicativo”, como se suele 
decir. Lo que en lógica y matemáticas se llama hoy impredicatividad —y 
que algunos autores consideran como un abuso del lenguaje o al menos del 
pensamiento— consiste en esa forma de circularidad que Poincaré reputó 
viciosa y que Russell intentará caracterizar con más precisión." 


A Véase el Capítulo 1.7, nota 4. Para mayor confusión, Russell (1908) emplea la palabra 


“predicativo” en una tercera acepción. Como, en virtud de la teoría sin clases, no hay 
funciones proposicionales predicativas en el sentido de Russell (1906), y en virtud de 
la sintaxis adoptada, no es posible representar en la escritura conceptual una función 
proposicional impredicativa en el sentido de Poincaré (1906), la palabra ha quedado 
vacante y se la redefine entonces como sigue: Una función de orden n y una sola va- 
riable es predicativa, si esa variable es de orden n — 1; una función de varias variables 
es predicativa, si al reemplazar por constantes todas sus variables excepto una se ob- 
tiene una función predicativa de la variable restante (Russell LK, p. 78). Más adelante 
veremos qué es lo que aquí se llama el orden de una función o de una variable. 
Whitehead y Russell 1910/13 reiteran esta definición (PM, IL, 53), pero dan también 
otra más sencilla que, en virtud de la sintaxis adoptada en ese libro, resulta ser equiva- 
lente a la anterior: “Se dice que una función es predicativa cuando es una matriz”, esto 
es, cuando “no envuelve variables ligadas (apparent variables)” (PM, L 164, 163). 


2.4 La teoría de los tipos lógicos 191 


En “La lógica matemática basada en la teoría de los tipos” (1908), Russell 
ofrece una solución detallada de las paradojas. Muchos pasajes de este artí- 
culo se reproducen sin variación en Principia Mathematica y aunque es 
posible señalar diferencias de doctrina entre ambas obras, aquí no les pres- 
taremos atención.?! El artículo empieza con una lista de siete paradojas, 
encabezada por la clásica paradoja del mentiroso, que no habíamos encon- 
trado en la literatura comentada hasta aquí, pero que ilustra con especial 
elocuencia la circularidad denunciada por Poincaré: si digo “estoy mintien- 
do” lo que digo es falso si es verdad y es verdad si es falso.?? Según Russell, 
cada una de las paradojas de su lista da por supuesta “una totalidad que, si 
fuera legítima, instantáneamente se incrementaría con nuevos miembros de- 
finidos en términos de ella misma” (LK, p. 63). Esta observación debe lle- 
varnos, según él, a adoptar la regla siguente: 


“Lo que envuelve el todo de una colección (all of a collection) no puede 
ser un miembro de esa colección”; o, recíprocamente: *Si, en caso que 
cierta colección tuviera un total, tendría miembros definibles sólo en tér- 
minos de ese total, dicha colección no tiene un total”. 

(Russell LK, p. 63) 


21 Rodríguez Consuegra 1989, pp. 153ss. estudia el significado de esas diferencias a la 


luz de manuscritos inéditos que Russell redactó por esos años. Russell 1910 es una 
exposición de la teoría de los tipos contemporánea de PM, destinada a rebatir las crí- 
ticas de Poincaré a Russell 1908. Este artículo se publicó en francés; el original inglés 
se hallará en Russell, EA, pp. 215-52. 

Cf. Cicerón, Academica, 11.95: “Si te mentiri dicis idque verum dicis, mentiris?” Atri- 
buida por Diógenes Laercio (1.108) a Eubúlides de Mileto, un contemporáneo de 
Aristóteles, la paradoja del mentiroso debe su difusión sobre todo a la epístola de San 
Pablo a Tito (1.12; cf. Calímaco, H. 1.7), donde se alude a cierto “profeta”, quien ha- 
bría dicho que “los cretenses son siempre mentirosos” (Kpftec Gel wedoto1), siendo 
así que él mismo era cretense. En el artículo “Insolubilia” del Dictionary of Philosophy 
and Psychology de Baldwin (1901-1905), C. S. Peirce presenta una versión de la para- 
doja como paradigma de “una clase de sofismas en los cuales se plantea una cuestión 
de tal índole que, ya sea que se responda afirmativa o negativamente a ella, un argu- 
mento formalmente impecable demostrará que la respuesta es falsa” (CP, 2.618). Peirce 
menciona dos métodos de solución propuestos en la Edad Media. Uno, adoptado por 
Ockam, arguye que “ninguna proposición puede aseverar nada acerca de sí misma”. 
En “Les paradoxes de la logique” (1906b), Russell cita el artículo de Peirce a propó- 
sito justamente de este método de Ockam (EA, p. 196, mn. 2 y 3). Obsérvese que el 
original inglés de “Les paradoxes de la logique” sigue a Peirce también en su título: 
“On *Insolubilia? and their Solution by Symbolic Logic” (19060). 
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Principia Mathematica repite textualmente los dos enunciados de esta regla 
y le da un nombre: “el principio del círculo vicioso” (PM, L, 37). Este prin- 
cipio impone un orden jerárquico a las funciones proposicionales. Según 
Whitehead y Russell, la característica esencial de una función es su ambi- 
gúedad. Cuando hablamos de “bx” sin especificar x, nos referimos a un valor 
indeterminado de la función. Si los valores de la función son da, qb, dc, ...., 
podemos decir que “px” denota ambiguamente a da, Qb, qc,... 


Por lo tanto, “px” sólo tiene un significado bien definido (es decir, bien 
definido excepto en cuanto es de su esencia ser ambigua) si los objetos 
pa, bb, dc, etc., están bien definidos. En otras palabras, una función no es 
una función bien definida a menos que todos sus valores ya estén bien 
definidos. De esto se desprende que ninguna función puede tener entre 
sus valores algo que presuponga la función, pues, si lo tuviera, no podría- 
mos considerar que los objetos ambiguamente denotados por la función 
están definidos mientras la función no estuviera definida, mientras que, a 
la inversa, como acabamos de ver, la función no puede estar definida 
mientras no lo estén sus valores. Este es un caso particular, pero tal vez 
el más fundamental, del principio del círculo vicioso. 

(Whitehead y Russell, PM, L 39) 


Imitando a Whitehead y Russell, designaré a la función cuyos valores son 
da, 4b, bc, etc. con el símbolo *p2”. A la luz del texto citado, es claro que 
dp2 no puede ser un valor de esa función. Más aún, una expresión como 
“p42” simplemente no tiene sentido.? Así, la paradoja russelliana del predi- 
cado *...es un predicado que no es predicable de sí mismo” no puede si- 
quiera enunciarse. En efecto, si usamos la letra “yw” para simbolizar dicho 
predicado, su definición sería: V0X(ybX* < —(0%). Pero la fórmula a la 
derecha del signo de equivalencia es inadmisible. 

Russell (1908) resucita la terminología que ya le vimos utilizar en 1903: 
los objetos que forman el ámbito de significación de una función proposicional 
$2 —esto es, los objetos a, b, c,... tales que ba, bb, bc, ... son valores de 
$¿— constituyen un tipo de objeto al cual p2 misma no pertenece. La fun- 
ción (2, por su parte, forma con otras funciones un tipo diferente que es el 
ámbito de significación de funciones proposicionales de un tercer tipo, y así 


Es Dicho sea de paso, en el libro de Whitehead y Russell el resultado de reemplazar x por 


QZ en qx no se escribe 4%, sino Q(p2), una inconsecuencia que prefiero no imitar. 
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sucesivamente. Whitehead y Russell (PM, I, 475.) aducen dos razones —nada 
concluyentes a mi modo de ver— para probar que tales tipos no pueden tener 
un elemento en común.?* Por lo tanto, si a es un valor de la función 4% y 
WoZ es un valor de una función 'Y9, Ya no puede ser un valor de P$ y la 
expresión “Pa” no tiene sentido. Llamaré “individuos? —como Whitehead y 
Russell — a los objetos que no son funciones proposicionales ni proposicio- 
nes.2 Según nuestros autores, todos los individuos forman un solo tipo, que 
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La primera razón propuesta es esta: Una función no puede servir de argumento a otra 
cuyo ámbito de significación incluya objetos individuales, porque una función no es 
un objeto definido sino “una mera ambigiiedad a la espera de una determinación [... ], 
y obviamente no la obtiene con sólo reemplazar a algo determinado en una proposi- 
ción”. Por eso los nombres “Whitehead” y “Poincaré” pueden sustituir a la variable x en 
la función proposicional *x es un matemático inglés”, generando, respectivamente, una 
proposición verdadera y una falsa, pero si reemplazamos la x por el nombre de una 
función proposicional como, por ejemplo, *z es una estrella de quinta magnitud” el re- 
sultado carece de sentido. Whitehead y Russell reconocen que el citado argumento no 
se aplica a una función proposicional de una o más variables si todas estas están liga- 
das (de modo que lo que tenemos entre manos no es propiamente una función 
proposicional sino una proposición generalizada). Sirva “(x).Px > Kx” para abreviar la 
proposición generalizada “Todo planeta describe una elipse en uno de cuyos focos está 
el sol”. Entonces, obviamente, la expresión “(x).Px > Kx es un matemático inglés” ca- 
rece de sentido, aunque las partes de que consta no adolecen de indefinición. “Necesi- 
tamos, entonces, una nueva objeción, a saber, la siguiente: Una proposición no es un 
ente singular, sino una relación entre varios; por lo tanto, una aseveración en que figu- 
re una proposición como sujeto sólo será significativa si puede reducirse a una aseve- 
ración sobre los términos que figuran en la proposición. [ ... ] Pero esto no es posible 
en el caso de una aseveración tal como “p es un hombre”, donde p es una proposición. 
Por eso “((x).4x) es un hombre” carece de sentido” (PM, I, 48; cursiva mía). El argu- 
mento depende de la oración que he destacado en cursiva. No logro imaginarme qué 
pudo inducir a los autores a pensar que esa oración es verdadera. El ejemplo siguiente 
demuestra que no lo es: “El Teorema de Pitágoras se deduce de los axiomas de Hilbert 
para la geometría euclidiana”. La relación de deducibilidad que aquí se afirma que 
subsiste entre una cierta proposición y un determinado grupo de proposiciones no pue- 
de aseverarse de los términos —puntos, rectas, etc.— que figuran en dichas proposi- 
ciones, ni siquiera es equivalente a una relación que subsista entre esos términos. 


PM, IL, 51, 132. En la p. 162 los autores dicen: “Podemos explicar un individuo como 
algo que existe por su propia cuenta; entonces, obviamente no es una proposición, puesto 
que las proposiciones, según se explicó en el Capítulo II de la Introducción (p. 43), 
son símbolos incompletos, que no tienen significado sino cuando de las usa [en un 
contexto].” Pero en la p. 161 advierten que “en la práctica no es necesario saber qué 
objetos pertenecen al tipo más bajo, ni si el tipo más bajo de variable que figura en un 
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llamaré “0”. Si 2 es una función proposicional de una variable cuyo ámbito 
de significación es el tipo £, digo que q% es del tipo (1). A la luz de lo dicho, 
parecería que los tipos de las funciones de una variable —los atributos — 
forman una jerarquía isomórfica a la serie de los números naturales: (0), ((0)), 
(((O0)), ... En esta jerarquía, cada tipo sería el ámbito de significación de 
las funciones del tipo siguiente. En cambio, las funciones proposicionales de 
dos o más variables —las relaciones— no podrían en ningún caso ordenarse 
con tanta nitidez. Sea Q%; ... Z, una función de n variables y ba; ... a, una 
proposición obtenida desambiguando esa función. Sean f,,...., f, los tipos 
—posiblemente diversos— a que pertenecen respectivamente los objetos deno- 
tados por los términos a,,...., a,. El ámbito de significación de q2,...Z, 
sería entonces el producto cartesiano f,x ... Xx f,. Digamos entonces que 
$2, ...Z, es una función del tipo (t,,..., £,). Por ejemplo, si wab se lee 
“Pedro ama a Teresa”, yw2% es una relación binaria del tipo (0,0). Si dacd 
dice que “Pedro antepone el patriotismo al amor”, tenemos que a es un ob- 
jeto del tipo O, c es un atributo de individuos, esto es, un objeto del tipo (0), 
y d es justamente la relación del tipo (0,0) que antes llamé y2£. Por lo tan- 
to, $92 es una función del tipo (0,(0),(0,0)). Como es concebible que haya, 
por ejemplo, funciones del tipo 


(((0),(0)),(0,0,(0,(0))),((((0))),0)) 


y de otros aún más endiablados, no podemos ordenarlas numéricamente de 
un modo natural. 

El sistema descrito en el párrafo anterior se llama —¡increíble pero cier- 
to! — la teoría simple de los tipos. Como ya indiqué, ella disuelve sin dificul- 
tad la paradoja de Russell (también las de Cantor y Burali-Forti). Pero, como 
veremos enseguida, no es compatible con el principio del círculo vicioso, 
por lo cual Whitehead y Russell, en la primera edición de Principia Mathe- 


dado contexto es el de los individuos o es otro. Pues en la práctica sólo importan los 
tipos relativos de las variables; así el tipo más bajo que figura en un dado contexto 
puede llamarse *de los individuos” por lo que hace a ese contexto. [... ] Lo esencial 
es el modo cómo los otros tipos se generan a partir de individuos, como quiera que 
esté constituido el tipo de los individuos.” 
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matica, adoptan la llamada teoría ramificada de los tipos. La cita siguiente 
explica por qué no pueden aceptar la idea de que las funciones que compar- 
ten un dado ámbito de significación formen entre todas un tipo: 


Sea f(Q2,x) una función de las dos variables p2 y x. Entonces si, mante- 
niendo a x fija por el momento, aseveramos esto con todos los valores 
posibles de q, obtenemos una proposición: 


(0).£(02,x). 


Aquí, si x es una variable, tenemos una función de x; pero como esta 
función envuelve una totalidad de valores de 2, no puede ser ella misma 
uno de los valores incluidos en esa totalidad, en virtud del principio del 
círculo vicioso. Se sigue que la totalidad de valores de p2 a que concierne 
(9).£(92,x) no es la totalidad de todas las funciones en que x puede figu- 
rar como argumento, y que no existe una totalidad de todas las funciones 
en que x puede figurar como argumento. 

(Whitehead y Russell, PM, L, 48-49)? 


Sea £ un tipo cualquiera y Y una colección de funciones cuyo ámbito de 
significación es £. Si a es un objeto cualquiera del tipo f, entonces la oración 
“a satisface todas las funciones (2 de la colección Y” expresa una proposi- 
ción. Si en ella reemplazamos la constante a por la variable x obtenemos 
una fórmula representativa de una función proposicional que llamaré y2. Pero 
entonces, aunque el ámbito de significación de y2 también es el mismo tipo 
t, el principio del círculo vicioso no permite que y pertenezca a %, puesto 
que y2 se refiere a la totalidad de F.27 No hay derecho a hablar de un tipo 


y Pido al lector disculpas por el simbolismo confuso e inconsecuente, pero no me ha 


parecido lícito alterarlo en esta cita textual. Nótese que la variable (2 de la primera 
oración pasa a ser q en la oración siguiente; luego, en la fórmula destacada, reviste 
ambas formas, tocándole al lector adivinar que Q% es la variable ligada por el 
cuantificador universal (p). (Cien páginas más adelante, en PM, I, 165, Whitehead y 
Russell nos explican que adoptaron esta práctica “en aras de la brevedad”; aunque ella 
responde también a un motivo menos inocente, como se verá en la nota 35). Tampoco 
es justo, después que se ha dicho que x es una variable, hablar de “las funciones en 
que x puede figurar como argumento”: un argumento de una función es en cada caso 
un objeto determinado 0, metonímicamente, un término constante que lo designe. 


al Si una función p$ pertenece a Y si y sólo si £Q$, la fórmula representativa de la fun- 


ción que he llamado wy2 debe escribirse ($ (FH$ > dx) en la notación de PM. 
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(0) al que pertenecerían todas las funciones cuyo ámbito de significación es 
el tipo O de los individuos. Cualquier totalidad de funciones de una variable 
que admitan individuos como argumento tiene necesariamente que excluir 
algunas funciones con ese ámbito de significación. En general, para satisfa- 
cer el principio del círculo vicioso, las funciones que tienen un mismo ám- 
bito de significación tienen que repartirse en diversos “órdenes”, ninguno de 
los cuales incluye una función que se refiera a todo ese orden.?8 
Whitehead y Russell no dan una caracterización global precisa de su sis- 
tema “ramificado”. En vez de intentarla por mi cuenta, me limitaré a resu- 
mir las indicaciones que ellos juzgaron suficientes para darse a entender.” 


E La palabra “orden” (order) se emplea de este modo en PM, *12. En el pasaje de la 


Introducción arriba parafraseado, Whitehead y Russell escriben “tipo” (type). Hablan de 
lo que llaman “a-functions”, esto es, las funciones proposicionales cuyo ámbito de signi- 
ficación comprende un dado objeto a. El texto original dice así: “What is necessary 
therefore in order to avoid vicious-circle fallacies, is to divide our a-functions into “types,” 
each one of which contains no functions which refer to the whole of that type” (PM, L 
50). 

Como ellos mismos admiten en el prólogo de la 1* edición, “la explicación de de la 
jerarquía de los tipos en la Introducción difiere un poco de la dada en el *12 en el 
cuerpo de la obra” (PM, p. vii). Sigo de preferencia esta última. Church (1976, 1984) 
ofrece una reconstrucción rigurosa de la teoría ramificada de los tipos. Para que el lector 
se haga una idea de lo que ello entraña, resumo en esta nota sus principales reglas de 
sintaxis. La clasificación en órdenes y tipos —que Church llama r-tipos, para distin- 
guirlos de los simples tipos de la teoría simple— se aplica en primer lugar a las varia- 
bles, en segundo lugar a las constantes con que es lícito sustituirlas. Los r-tipos están 
agrupados en lo que Church llama niveles (levels), cada uno de los cuales se conoce 
por un número natural. Dichos niveles son acumulativos: el recorrido de una variable 
de cierto r-tipo incluye los recorridos de todas las variables de nivel inferior al suyo. 
El nivel 1 corresponde a las variables cuyo recorrido sólo contiene lo que Whitehead 
y Russell llamaban funciones predicativas. La escritura conceptual adoptada compren- 
de los símbolos lógicos de negación, disyunción y cuantificación universal, paréntesis, 
una lista infinita de variables de cada r-tipo y listas finitas —posiblemente vacías — de 
constantes de distinto r-tipo. Hay un tipo ¡ integrado por las variables individuales. Si 
Bi... ,B,, son r-tipos (mm > 0), hay un r-tipo (B;, .. . .B,,)/n integrado por variables pre- 
dicativas m-arias de nivel n (n > 1). El r-tipo (0.;,... ,0L,,)/k es inferior al r-tipo 
(Bi --- B,)/n si y sólo sik<n y 0, =P, (1 <h<m). Si PB, =... = fP,, = i, en vez 
de (i, ...., 1) escribimos m. El orden de una variable € se define recursivamente así: (1) 
si £ es del r-tipo i, el orden de £ es 0; (ii) si € es del r-tipo (B;,... P,,)/n y N es el 
orden más alto que puede tener una variable de uno de los r-tipos f,,... f,,, el orden 
de £ es N + n. Una fórmula está bien formada (i) si consta sólo de una variable 
proposicional, esto es, una variable de alguno de los r-tipos 0/n; (11) si consta de una 
variable del r-tipo (B,,... ,B,,)/n (m > 0) seguida de m variables y la h-ésima variable 
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En aras de la fidelidad histórica, no me esforzaré en aclarar si las proposi- 
ciones, funciones proposicionales, variables libres y ligadas, y otros entes 
por el estilo, de que tendré que hablar, son expresiones lingiiísticas u objetos 
suprasensibles. La necesidad de ser completamente inequívoco en este res- 
pecto, inculcada más tarde por Hilbert y sus discípulos, aparentemente no 
fue reconocida por Whitehead y Russell. Llamaré, con ellos, matriz a una 
función proposicional de n variables (n > 1) que no contiene ninguna varia- 
ble ligada. De una matriz (%, ... X, se derivan funciones que no son matri- 
ces, por generalización universal o existencial sobre una de sus variables; 


simbólicamente: VxHE; > Lit E Y 0% A 
< k< n).% Según Whitehead y Russell, “toda función posible que no sea 
una matriz se deriva de una matriz” por una o más generalizaciones (PM, I, 
162).3! Definiremos recursivamente el orden de una variable, matriz, fun- 


(1 <h< m) es del r-tipo f,; (111) si se obtiene reemplazando variables por constantes 
del mismo r-tipo en una fórmula bien formada como la descrita en (ii); (tv) si se cons- 
truye a partir de fórmulas bien formadas por negación, disyunción o cuantificación. 
Además de las reglas de inferencia habituales de un cálculo predicativo de orden ma- 
yor que 1, Church adopta dos axiomas (esquemáticos) de comprensión: 


(D 3p(p > P), donde p es una variable del r-tipo 0/n que no figura como varia- 
ble libre en P, todas las variables ligadas de P son de orden menor que n y nin- 
guna constante ni variable libre de P es de orden mayor que n. 

(ID) Vx; ... VX, (fx; .. - Xx, <> P), donde f es una variable predicativa del r- 
tipo (Bj, ... P))/N, Xj, - . . , X,, son variables diferentes de los r-tipos By, .. . Bj,» 
respectivamente, que pueden figurar como variables libres en P, todas las varia- 
bles ligadas de P son de orden menor que el orden de f y ninguna constante ni 
variable libre de P es de orden mayor que el orden de f. 


20 Whitehead y Russell hubiesen escrito 


Ars 1 0 + + 4) en vez de VxibXr ir + E Y 

Eds + + L) en vez de TX + Ep 
Olvidan, aparentemente, que una función puede derivarse también de varias matrices, 
combinando las dos formas de generalización con la negación y la disyunción. Tal olvido 
resulta inofensivo en el caso de las matrices de primer orden (que sólo contienen va- 
riables que designan ambiguamente individuos), pues, si Q£,...XÍ, es una función 
proposicional de n variables individuales formada a partir de varias matrices por cual- 
quier combinación de generalizaciones, negaciones y disyunciones, hay una función 
proposicional “prenexa” Qz; ... Q2,W231 ---2, 1... X,, lógicamente equivalente a 
0%, ... £,, y formada por generalizaciones sucesivas a partir de la matriz de primer 
orden y%;... £,f, ... X, (véase el Apéndice XIII; la Q representa indistintamente un 
signo de cuantificación existencial o universal). 
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ción o proposición. Diré que una variable es de orden O si los objetos ambi- 
guamente designados por ella son individuos, y que es de orden n (n > 1) si 
tales objetos son funciones de n-ésimo orden. Una matriz se dice de pri- 
mer orden si sólo contiene variables de orden O. Una función se dice de 
primer orden sí es una matriz de primer orden o se deriva de una matriz de 
primer orden por generalización. Si se ligan por generalización todas las 
variables libres de una matriz de primer orden, se obtiene una proposición 
de primer orden. Una matriz cuyas variables son todas de orden menor que 
n > 1 y que contiene por lo menos una variable de orden n — 1 se dice de 
n-ésimo orden. Una función se dice de n-ésimo orden si es una matriz de n- 
ésimo orden o se deriva de una matriz de n-ésimo orden por generalización. 
Si se ligan por generalización todas las variables libres de una matriz de n- 
ésimo orden, se obtiene una proposición de n-ésimo orden. Evidentemente, 
una función o proposición de n-ésimo orden sólo contendrá variables de orden 
menor que n y por lo menos una variable de orden n — 1. Con exasperante 
exuberancia terminológica, Whitehead y Russell, en vez de matriz, suelen 
decir función predicativa (vide supra, p. 190, n. 20).7 Para distinguir la re- 
presentación simbólica de una función predicativa o matriz de la de otras 
funciones insertan un signo de admiración después de la minúscula griega 
inicial, por ejemplo, así: b!x, w!(x,y). Este método de representación se ex- 
tiende también a las proposiciones que se derivan de una matriz mediante la 
sustitución de todas sus variables por constantes (llamadas proposiciones ele- 
mentales si la matriz en cuestión es de primer orden). 

La teoría ramificada de los tipos resuelve todas las paradojas que hemos 
mencionado. A modo de ejemplo, cito dos de sus soluciones. Cuando el menti- 
roso dice “estoy mintiendo”, o bien habla sin sentido —en cuyo caso no hay 
paradoja—, o bien dice que una proposición p aseverada por él es falsa. Sea 
p de orden n. Entonces, la proposición “estoy mintiendo”, que se refiere a p, 
es de orden superior a n y por lo tanto no puede ser idéntica a p (Russell 
LK, p. 79).2% Consideremos ahora la paradoja de Berry. Ella concierne a la 


32 Whitehead y Russell no asignan órdenes a la variables en la explicación que estoy 


parafraseando, pero en PM, L, 167 hablan, sin previo aviso, de una “variable ligada de 


orden n”, en una acepción que no puede ser otra que la que defino en el texto. 


33 Whitehead y Russell (PM, I, 38) se valen de un razonamiento análogo para disolver un 
ridículo argumento contra el escepticismo que todavía suele escucharse. Conforme a 


ese argumento, quien asevera que no sabe nada se contradice, pues reclama saber al 


T LA CONFUSIÓN ES MÍA. RECTIFICO: Una función predicativa es una función 


proposicional que no contiene variables ligadas de orden superior a sus variables 
libres. Una matriz, en cambio, no contiene variables ligadas. [R.T.-2005] 
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función proposicional “x es el entero positivo más pequeño que no se puede 
describir en castellano con menos de dieciocho palabras”. Usaré la expresión 
simbólica “Pg” para decir que £ es una función proposicional de una varia- 
ble expresable en castellano con menos de 18 palabras (además de la varia- 
ble x y la cópula “es”). Escribiré Nx para decir que x es un entero positivo y 
x < y para decir que el entero x es menor o igual que el entero y. Conforme 
al análisis de Russell (1905), la función involucrada en la paradoja de Berry 
puede entonces simbolizarse así: 


yx = y A Ny a VoZ((dy > = Yo0Z) A 
Vw((Nw a (6w > —= 'Pd2)) > y < w))) 


La variable ligada (2 tiene necesariamente un orden determinado n, inferior, 
por cierto, al de la función en que figura. Por lo tanto, no es contradictorio 
afirmar en castellano que un cierto número q satisface esta función, aunque 
ello entrañe describir a q con menos palabras que las que se está diciendo 
que hacen falta para eso. Aunque q no satisfaga ninguna función de orden n 
expresable en castellano con menos de 18 palabras, bien puede satisfacer una 
función de orden mayor que n expresable en castellano con sólo 17 pala- 
bras.** 

La victoria de Russell y Whitehead sobre las paradojas tiene un precio 
que a muchos ha parecido excesivo. El inconveniente de la teoría de los ti- 
pos que más salta a la vista es que ella multiplica los entes más allá de todo 
lo que uno se hubiera nunca imaginado que podía ser necesario. Piénsese en 
la relación de identidad. Normalmente pensaríamos que la función propo- 
sicional £= $ genera una proposición verdadera si sus dos variables se re- 
emplazan por nombres o descripciones de una misma cosa, cualquiera que 
sea, y genera una proposición falsa si se las reemplaza por nombres o des- 


menos eso que asevera. Según la teoría de los tipos, la oración 'no sé nada” sólo puede 
expresar que no hay ninguna proposición de orden menor que cierto entero positivo n 
que diga algo que yo sé. Pero el orden de la proposición así expresada es, entonces, 


por lo menos igual a n. 


sá Las dos soluciones citadas y otras cinco más —correspondientes a las paradojas de 


Burali-Forti y Richard y dos formas de la paradoja de Russell — aparecen en Whitehead 
y Russell, PM, L 62-64. Church 1976 da una formulación y solución rigurosas de la 
paradoja de Grelling citada en la nota 19. 
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cripciones de dos cosas distintas, cualesquiera que sean. Pero según la teoría 
de los tipos no puede haber una función proposicional cuyo ámbito de sig- 
nificación sea la totalidad de las cosas (ni, mucho menos, el producto carte- 
siano de dicha totalidad consigo misma). Tiene que haber por eso muchas 
relaciones de identidad diferentes, una para cada tipo. El símbolo *=”, en que 
veíamos un paradigma de la univocidad, se nos revela así como infinitamen- 
te ambiguo. No menos ambiguo es el símbolo *A” con que Whitehead y 
Russell designan lo que llaman la clase nula, esto es, la clase X(x 4 x) que 
contiene a todo objeto x que no es idéntico a sí mismo (PM, Il, 216).% Aná- 
loga ambigiiedad afecta a los números cardinales. El cardinal de la clase K 
—]llámemosle |Kl— es la clase de todas las clases similares a K, es decir, de 
todas las clases X tales que hay una correspondencia biunívoca cuyo domi- 
nio es X y cuyo codominio es K (Russell LK, p. 96). Pero, como explico en 
la nota 35, una clase es sólo una manera de hablar de funciones propo- 
sicionales de cierto tipo y en el caso de I|Kl dicho tipo depende del tipo de 
los objetos de las clases X y K. Así, variando X, se obtienen infinitos signi- 
ficados de “IKl” y sólo excepcionalmente será correcto decir que |Kl = 1X1,3 
La matemática puede sin duda arreglárselas con este resultado, sobre todo 


de Cuando se habla de clases a propósito de Principia Mathematica hay que entender esto 


a la luz del *20 de ese libro, donde se expone una “Teoría General de las Clases” que 
“evita suponer que haya algo así como clases” (PM, L, 187). La expresión simbólica 
“X(0x)” —léase: “la clase de los x tales que (x”— no tiene ningún significado por sí 
misma, sino sólo en contexto: en el *20.01, se introduce la expresión “f(*(4x))” como 
abreviatura de 


AW(F(y 12) A Vx(ylx O 0x)) 


En otras palabras, la frase “la clase de los x tales que qx tiene la propiedad f” consti- 
tuye una manera cómoda de decir que existe una función predicativa y que tiene la 
propiedad f y es tal que, cualquiera que sea el objeto x (del tipo pertinente), x tiene y 
si y sólo si x tiene q. (El lector observará, de paso, que no fue sólo “en aras de la 
brevedad” que Whitehead y Russell adoptaron la notación inconsecuente que comenté 
en la nota 26; en la fórmula recién citada, el cuantificador existencial liga la variable 
simbolizada con wy!í al lado izquierdo de la conjunción y con wy! al lado derecho). 


de Si se estipula que la función £ = $, aunque “ambigua en cuanto al tipo”, es en todos 


los casos una función de dos variables del mismo tipo, resulta que *IKl = 1XI” por regla 
general ni siquiera tiene sentido, ya que, aunque los objetos en K (por ejemplo, los 
dedos de mi mano derecha) estén en correspondencia biunívoca con los objetos en X, 
no tienen que ser del mismo tipo que éstos (que podrían ser, por ejemplo, las funcio- 
nes proposicionales que se generan reemplazando la variable y por el número de gra- 
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si, siguiendo el ejemplo de Whitehead y Russell, utiliza sin remilgos un solo 
símbolo para representar propiedades o relaciones análogas de distinto tipo. 
Hay, con todo, cierta ironía en que la prosecución de su programa logicista 
llevara a Russell a admitir que un símbolo como *7” designa simultáneamen- 
te infinitas clases diferentes. En efecto, Russell rechazó el estructuralismo 
de Dedekind —para quien, como vimos en la Sección 2.3.2, cualquier siste- 
ma simplemente infinito tiene derecho a llamarse “la serie numérica'— y 
patrocinó en cambio, como Frege, la definición de los números en términos 
puramente lógicos, porque “queremos números que sirvan para contar los 
objetos comunes, y esto requiere que nuestros números tengan un significado 
determinado (definite), y no meramente que posean ciertas propiedades for- 
males” (Russell 1919, p. 10). 

Mas la teoría de los tipos no sólo hace irrisoria una de las motivaciones 
que animaron el logicismo, sino que contradice directamente la pretensión 
de deducir todas las proposiciones de la matemática pura de un pequeño 
número de principios lógicos fundamentales. Se recordará que para demos- 
trar la existencia del siguiente de cada número finito Frege agregaba cada 
número finito n a la clase de n miembros integrada por los predecesores de 
n, con lo cual formaba una clase cuyo número era justamente el siguiente de 
n (véase la demostración de [F2], pp. 172-74). Pero en virtud de la teoría de 
los tipos, si n =1Kl, donde K es la clase integrada por ciertos objetos a,,...., 
a, n es un Objeto de otro tipo que a;,,...., a, y no puede pertenecer junto 
con ellos al ámbito de significación de una misma función proposicional. 
Por lo tanto, los objetos a;,...., a, y n no forman una clase K” tal que |K'| 
= (n + 1). Para salvar la aritmética bajo estas condiciones, hay que postular 
que, si K es una clase finita de objetos de un tipo dado, existe siempre un 
objeto a de ese mismo tipo que no está contenido en la clase K; entonces el 
número de la clase K U (fa) será precisamente el siguiente de |Kl. Tal pos- 
tulado equivale al axioma que Whitehead y Russell llaman /nfin ax —por 
“Infinity axiom' — y adoptan formalmente (PM, *120.03). Éste dice que si 
al es un “cardinal inductivo” (esto es, un número finito en el sentido de Frege), 
existe por lo menos una clase —del tipo en cuestión— que contiene precisa- 


mos que pesa cada uno de los dedos de mi mano derecha en la expresión “x es un 
número real mayor que y”). 
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mente a. elementos.*” Whitehead y Russell no pretenden hacer pasar este 
axioma por un principio lógico. Según ellos, Infin ax —al igual que su ver- 
sión del Axioma de Selección, Mult ax (*88.03)— es “una hipótesis aritmé- 
tica que algunos juzgarán evidente por sí misma, pero que preferimos man- 
tener como hipótesis, aduciéndola como tal [esto es, como antecedente de 
una implicación material —R.T.] cada vez que sea pertinente” (PM, II, 203). 

Aparte de que destruye el sueño logicista que la inspiró en sus inicios, la 
teoría de los tipos amenaza la posibilidad misma de la matemática en su forma 
clásica. Como atinadamente señala Zermelo (1908, p. 524; citado en la p. 
69), ésta abunda en conceptos definidos sin prestar ni la más mínima aten- 
ción al alegado “principio del círculo vicioso”. Un caso ejemplar, aludido 
por Zermelo y analizado por Weyl (1918, p. 23) y Ramsey (1931, p. 64), es 
el concepto del supremo o cota superior mínima de un conjunto de números 
reales, tan importante en la fundamentación clásica del análisis. La circu- 
laridad inherente a su definición puede exhibirse fácilmente partiendo de la 
caracterización abstracta del sistema de los reales como un cuerpo* arquimé- 
dico completo presentada en el Glosario. Decimos que un número real o, es 


cd *120.03 designa con el nombre “Infin ax” a la aseveración ambigua en cuanto al tipo 


que dice que si o. es un cardinal inductivo, existe un objeto x tal que x e QL. Para 
mayor claridad, supongamos que a. es un cardinal del tipo más bajo posible (lo que 
digo a continuación puede luego transferirse mutatis mutandis a los tipos superiores). 
Esto significa que x e al si y sólo si x es una clase de individuos y a es la clase de 
todas las clases similares a x (dos clases a y b son similares si son del mismo tipo y 
hay una correspondencia biunívoca entre a y b; cf. PM, *73, especialmente *73.02 y 
*73.03). En particular, si llamamos, con Whitehead y Russell, 1a a la clase %(y = a) 
cuyo único miembro es el objeto a y A a la clase nula o vacía, tenemos que el cardinal 
O es la clase de todas las clases similares a A y el cardinal 1 es la clase de todas las 
clases similares a 1x (donde x es un cierto individuo, que evidentemente puede ser 
cualquiera sin afectar la identidad del objeto designado por *1”). Si a es un cardinal, a 
+ les la clase de todas las clases similares az U 'x, donde z € AY Xx £ 2, y por 
ende también es un cardinal. Si f = a + 1, digo que f tiene con a la relación (+1) 
(simbólicamente: P(+1)a). Digo que f tiene con a la relación (+1)* (simbólicamente: 
BEDa) si (1) Pr+Da ó (11) hay un cardinal y tal que P(+1)y y y(+D)*a. El cardinal a 
es inductivo si y sólo si a(+1)*0. Así pues la aseveración ambigua en cuanto al tipo 
que bautizamos Inf ax, referida a objetos del tipo más bajo posible, dice que si a. es 
cualquier cardinal obtenido por adiciones sucesivas de un individuo a la clase vacía 
hay una clase no vacía de individuos cuyo cardinal es a. Obviamente, esto equivale a 
decir que existe una provisión inagotable de individuos para ir generando clases de 
diferente numerosidad mediante adiciones sucesivas de un individuo a la clase vacía. 
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una cota superior del conjunto de reales K si G, es mayor o igual que todo 
k e K. El supremo de K, denotado por sup K, es la menor de las cotas su- 
periores de K. En otras palabras, si Y + K C R, sup K es un número real tal 
que (1) Vx(x € K<SR> x< sup K) y (ii) Vy(Vx(x € KCSR>x<y)> 
sup K < y). La cláusula (11) de la definición de sup K envuelve, pues, una 
referencia a la totalidad de los objetos y tales que Vx(x e Kc< R > x < y), 
uno de los cuales se pretende que sea el propio sup K, conforme a la cláu- 
sula (1). Con todo, la doctrina de Whitehead y Russell se apreciará mejor si 
consideramos este ejemplo en el contexto de una de las interpretaciones clá- 
sicas de los números reales como conjuntos de racionales. Siguiendo a 
Ramsey, utilizaré una reformulación de la interpretación de Dedekind (1872) 
similar a la adoptada en Principia Mathematica. Sea (Q),+,x,0,1) el cuerpo 
de los racionales (de un tipo dado). Una sección de (Q) es un conjunto no 
vacío r C () tal que, si ¿ e r y í e QNr, entonces E < £. Si u y v son 
secciones de (), diremos que u es mayor o igual que v si hay un ¿ e u 
mayor o igual que todo n e v. Sea |R el conjunto de todas las secciones de 
OQ. Se puede demostrar que la estructura (RR,+,X,0,1) es un cuerpo ar- 
quimédico completo —y, por ende, una interpretación legítima de los rea- 
les— si se estipula que O = (€ e€ Q: E < 0), que 1 = [é e Q: E < 1), y que, 
para todo u, ve R)u+v=X8+€:58Es8sunCevjyuXxv=48xC:8 
e unf e v). Sea K C Run conjunto no vacío tal que existe una cota 
superior de K, esto es, una sección de (2 mayor o igual que cualquier ele- 
mento de K. En tal caso, la unión de K, UK = (€ e O: 1:(É€ €x Ax € IR), 
es una sección de () que satisface la doble condición siguiente: (C1) para 
cada racional € contenido en un z e K hay un racional € e UK tal que € es 
mayor o igual que €, y (C2) si x e R es una cota superior de K hay un 
racional € e x mayor o igual que cualquier elemento de UK. Esto implica 
que UK es una cota superior de K menor que cualquier otra. Así pues hemos 
demostrado, al parecer, que si un conjunto no vacío K C R tiene una cota 


superior, K tiene una cota superior mínima o supremo UK e R. Pero la ca- 
racterización de UK viola manifiestamente el principio del círculo vicioso, 
por cuanto emplea la función proposicional 1x(€ € x Ax € R) que hace 
referencia a la totalidad de [R. La teoría de los tipos (ramificada) salva esta 
dificultad negando que las secciones de (2 formen una totalidad acabada. El 
conjunto [R que hemos tomado como base de nuestro cuerpo de los reales 
puede comprender, sí, todas las secciones de () caracterizables mediante fun- 
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ciones de cierto orden, pero la función empleada para caracterizar a UK tie- 
ne que ser en todo caso de otro orden, de modo que UK £ R. Resulta, en- 
tonces, que UK no forma sumas ni productos con los elementos de |R, ni 
entra en el ámbito de verdad de ninguna función proposicional satisfecha 
por esos elementos. Podremos siempre llamar a UK “el supremo de K” y 
reunirlo con los supremos —así entendidos— de los otros subconjuntos aco- 
tados de [R, en un cuerpo arquimédico completo diferente de ((R,+,x,0,1). 
Pero la existencia del supremo de cada conjunto acotado de reales no servirá 
al propósito con el cual se la demuestra en la fundamentación clásica del 
análisis. 

Una corriente minoritaria pero tenaz de la matemática del siglo XX sos- 
tiene que en vista de esto hay que descartar la fundamentación clásica del 
análisis y procurarle otra diferente, constructivista (Weyl 1918, Lorenzen 1965, 
Bishop 1967) o intuicionista (Brouwer 1907, 1930; Weyl 1921), aunque ello 
entrañe renunciar a ciertos teoremas que nos habíamos habituado a reputar 
verdaderos. Pero Whitehead y Russell no militan en esa corriente. Aunque 
éste se preguntaba cuánto habría que sacrificar de la matemática clásica para 
resolver las paradojas (Russell 1906, en EA, p. 156, citado arriba), cuando 
publican Principia Mathematica creen poder rescatarla entera. Con ese pro- 
pósito, adoptan el Axioma de Reducibilidad, en virtud del cual, si wZ es una 
función proposicional de cualquier orden hay siempre una función predicativa 
Q!2 con el mismo ámbito de significación que y2, tal que, para todo argu- 
mento idóneo x, 4!x si y sólo si yx. Aplicado al ejemplo que examinamos 
en el párrafo anterior, esto significa que si una función proposicional de 
cualquier orden circunscribe una clase de racionales, existe una función del 
orden mínimo que tiene exactamente el mismo ámbito de verdad y por lo 


dd Whitehead y Russell enuncian un Axioma de Reducibilidad para funciones de una 


variable y otro para funciones de dos variables (*12.1, *12.11), y señalan que no enun- 
ciarán otros porque esos dos son los únicos que utilizarán en su obra (PM, I, 167). 
Ambos son, por cierto, esquemas ambiguos en cuanto al tipo. En la escritura concep- 
tual de PM, el esquema correspondiente a una función proposicional de n variables se 
enunciaría así: 


EEN... A) 00 A 


(Las variables escritas como subíndices a la derecha del símbolo de equivalencia *=” 
deben leerse como cuantificadores universales, a la manera de Peano explicada en la p. 
149 después de la fórmula 50.) 
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tanto circunscribe la misma clase. Así, aunque el supremo de un conjunto 
acotado de elementos del cuerpo arquimédico completo [R tenga que carac- 
terizarse mediante una función proposicional que hace referencia a la totali- 
dad de R y, por lo mismo, no puede aplicarse a elementos de [R sin violar el 
principio del círculo vicioso, esto no importa: el Axioma de Reducibilidad 
nos asegura que si dicha función existe también hay otra que no hace refe- 
rencia a la totalidad de RR y expresa una condición satisfecha por los mismos 
racionales que satisfacen la condición expresada por la primera, de modo 
que ella también define la misma sección de (). El Axioma de Reducibilidad, 
claro está, no nos dice cuál es la función predicativa equivalente a una fun- 
ción no predicativa dada ni nos suministra un método para construirla. Más 
que un principio lógico o matemático, el Axioma de Reducibilidad parece la 
cruda expresión de un deseo. No es raro, entonces, que la seguridad que ofrece 
haya inspirado en general poquísima confianza, a pesar del ingenio invertido 
como ahora veremos en su defensa. 

El siguiente argumento en pro del Axioma de Reducibilidad se publicó 
primero con la sola firma de Russell (1908, $ V), pero reaparece en el *12 
de Principia Mathematica. Supongamos por un momento que las clases son 
objetos reales y que cada función proposicional pX£ determina la clase (x:Qx) 
a la que pertenece cada objeto que está en el ámbito de verdad de qQ%. El 
Axioma de Reducibilidad se deduce entonces fácilmente, ya que, bajo el 
supuesto indicado, si existe la función (% existe también la función y! 
definida por la condición (yw!x <> x e (x:0xp), la cual evidentemente es 
predicativa. Pero, como sabemos, nuestro supuesto implica también la para- 
doja de Russell y tiene que ser rechazado. En cambio, el Axioma de Redu- 
cibilidad —hasta donde sabemos— no implica paradoja alguna.?” Sería, se- 
gún eso, estrictamente más débil que dicho supuesto y, por ende, es un can- 
didato excelente para sustituirlo una vez que éste se probó demasiado fuerte. 
Como dicen nuestros autores: 


Para que sea posible la matemática, es absolutamente necesario [ ... ] que 
dispongamos de un método para hacer aseveraciones que habitualmente 
serán equivalentes a lo que queremos decir cuando hablamos (inexacta- 


22 Chwistek (1922) creyó haber derivado de él la paradoja de Richard, y Copi (1950) la 
de Grelling, pero estaban equivocados. Véase Copi 1971, pp. 96s. 
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mente) de “todas las propiedades de x”. (Una “propiedad de x” puede 
definirse como una función proposicional satisfecha por x.) Por lo tanto, 
hay que hallar, en lo posible, un método para reducir el orden de una 
función proposicional sin afectar la verdad o falsedad de sus valores. Pa- 
rece que esto es lo que el sentido común efectúa aceptando que hay cla- 
ses. Dada una función proposicional yx de cualquier orden, se supone que 
esto equivale, para todos los valores de x, a una aseveración de la forma 
“x pertenece a la clase a”. Ahora bien, suponiendo que exista un ente tal 
como la clase q, esta aseveración es de primer orden, puesto que no alu- 
de a ninguna función variable. De hecho, su única ventaja práctica sobre 
la aseveración original yx reside en que es de primer orden. No hay nin- 
guna ventaja en suponer que realmente hay clases, y la contradicción so- 
bre las clases que no son miembros de sí mismas muestra que, si hay 
clases, tienen que ser algo radicalmente diferente de los individuos. Pare- 
cería que el solo propósito al que sirven las clases y una razón capital que 
las hace lingúísticamente convenientes es que proveen un método para 
reducir el orden de una función proposicional. Por lo tanto, no supondre- 
mos nada de lo que parece entrañar la aceptación de las clases por el 
sentido común, excepto esto: que toda función proposicional es equiva- 
lente, para todos sus valores, a alguna función predicativa del mismo ar- 
gumento o argumentos. 

(Whitehead y Russell, PM, L, 166)% 


Llama la atención la frase “toda función proposicional” empleada en la última cláusula, 
ya que la generalización se refiere obviamente a una totalidad ilegítima. En el enuncia- 
do formal del Axioma de Reducibilidad en *12.1 no figura un cuantificador universal 
cuya variable ligada recorra todas las funciones proposicionales que comparten un dado 
ámbito de significación, pero cabe sostener que éste es un arreglo puramente cosméti- 
co. Como señala Wittgenstein, en una carta a Russell escrita probablemente en el ve- 
rano de 1913: 


Tu axioma de reducibilidad es F:(3f):Qx.=,.f!x. ¿No es esto un disparate (is this 
not all nonsense)? Puesto que esta prop[osición] sólo tiene un significado si pode- 
mos convertir la q en una variable ligada (apparent). Si no podemos hacerlo, nunca 
podrá deducirse ninguna ley general de tu axioma. El axioma mismo me parece 
en este momento sólo un truco de prestidigitador (a mere juggling trick). Díme 
por favor si encierra algo más. El axioma como lo habéis enunciado es sólo un 
esquema y la verdadera Pp debiera ser +:.(d):(3f):0x.=,.f!lx y ¿para qué serviría 
eso (what would be the use of that)? 

(Wittgenstein 1974, p. 26) 
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Dicen en otro lugar que la razón para aceptar un axioma, “lo mismo que 
otra proposición cualquiera” sólo puede ser “inductiva”, a saber, “que mu- 
chas proposiciones que son casi indudables se deducen de él, que no se conoce 
otra vía igualmente plausible por la cual esas proposiciones podrían ser ver- 
daderas aunque el axioma fuera falso, y que de él no se puede deducir nada 
que sea probablemente falso” (PM, IL, p. 59). En el caso del Axioma de 
Reducibilidad, las consecuencias que alegadamente lo hacen verosímil son, 
ante todo, los teoremas del análisis. Cuando Whitehead y Russell publican 
estas palabras en 1910, el cuestionamiento intuicionista del análisis clásico 
—“la amenaza bolchevique de Brouwer y Weyl” contra las matemáticas 
(Ramsey 1931, p. 56) — había recién comenzado y estaba confinada aún a la 
tesis doctoral, en holandés, y otros trabajos juveniles de Brouwer (vide Apén- 
dice XIX). Pero el mismo año 1908 en que Russell publicó el Axioma de 
Reducibilidad, Zermelo había trazado otra vía “por la cual esas proposiciones 
podrían ser verdaderas aunque el axioma fuera falso”, una que la gran ma- 
yoría de los matemáticos considera mucho más transitable que la teoría 
(ramificada) de los tipos combinada con el Axioma de Reducibilidad. Es 
interesante comparar las dos alternativas. Zermelo viene de la escuela de 
Cantor quien, como sabemos, nunca enseñó que cada predicado determinara 
un conjunto (ni que cada conjunto fuera caracterizable por un predicado). 
Desde este punto de vista, las paradojas no ocasionan una revolución del 
pensamiento, pero hacen muy aconsejable proceder con cuidado en la carac- 
terización de conjuntos mediante condiciones necesarias y suficientes. Los 
axiomas de Zermelo (1908a), concebidos ante todo para hacer perspicua su 
demostración del Teorema del Buen Orden, regulan tales caracterizaciones 
en una forma que —una vez revisada por Skolem y Fraenkel (Secciones 1.8.2 
y 1.8.3)— ha resultado generalmente adecuada a las necesidades de los 
matemáticos. La estrategia de Zermelo consiste en admitir como existentes 
sólo aquellos conjuntos que la experiencia matemática revela imprescindi- 
bles. Sigue, pues, lo que puede llamarse una vía minimalista y, por ende, 
genuinamente “inductiva”, en el sentido de Whitehead y Russell. Maximalista, 
en cambio, es la seguida por éstos al adoptar el Axioma de Reducibilidad, 
que postula la existencia de una función predicativa generalmente descono- 
cida y probablemente inefable para cada función proposicional que con- 
cibamos (y también para las que no concebimos). Tales entes son presumible- 
mente más tenues que los conjuntos que postula Zermelo, pero existencia es 
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existencia y Whitehead y Russell tienen que acomodarlos de alguna manera 
en su ontología. No se sabe cómo. En cambio, me parece claro que, a pesar 
de la anunciada neutralidad con respecto a la existencia de clases, Principia 
Mathematica las admite sólo como una manera de hablar (del modo descrito 
en la nota 35). En efecto, si una clase —o un conjunto— existe de veras no 
puede hacerle mella que la caractericemos impredicativamente. En tal caso, 
pues, no puede justificarse la prohibición contenida en el principio del círcu- 
lo vicioso.*! 

La Introducción a la segunda edición de Principia Mathematica (1927), 
escrita por Russell, propone varios cambios que el lector debe subentender 
en el cuerpo de la obra, reproducido de la primera edición con sólo peque- 
ñas correcciones. Uno de los más importantes es la supresión del Axioma de 
Reducibilidad. Para hacerla viable, se adopta la tesis de Wittgenstein de que 
todas las funciones de proposiciones son funciones veritativas —analizables, 
por ende, exhaustivamente en términos de disyunciones y negaciones (o de 
la sola “función palote” introducida por Sheffer)?— y que una función sólo 


ll Criticando el primer enunciado del principio del círculo vicioso —“Lo que envuelve el 


todo de una colección no puede ser un miembro de esa colección” — dice Gódel que 
esto vale “sólo si las entidades en cuestión han sido construidas por nosotros”: 


En este caso es claro que tiene que haber una definición (a saber, la descripción 
de la construcción) que no se refiere a una totalidad a la que pertenece el objeto 
definido, pues la construcción de una cosa ciertamente no puede basarse en una 
totalidad de cosas a la que pertenezca la cosa misma que ha de ser construida. Sin 
embargo, si se trata de objetos que existen independientemente de nuestras cons- 
trucciones, entonces no hay nada absurdo en la existencia de totalidades que con- 
tengan miembros que sólo puedan ser descritos (esto es, caracterizados 
unívocamente) por referencia a esa totalidad. 

(Gódel 1944, p. 136s.) 


Conviene leer toda la crítica al principio del círculo vicioso en Gódel 1944, pp. 133— 
37 (trad. castellana en Gódel, OC, pp. 322-26). 


de La función palote (stroke function) de Sheffer, llamada así porque se la representa me- 
diante el signo l, es la función veritativa binaria definida por las condiciones (1) plg es 
verdadera si p y q son ambas falsas, y (ii) de otro modo, plg es falsa. Como evidente- 
mente —p si y sólo si plp y p v q si y sólo si (plg)l(plg), es claro que cualquier función 
veritativa puede caracterizarse mediante combinaciones de palotes. Las proposiciones 
generales se reducen a funciones veritativas si entendemos, con Wittgenstein, que la 
generalización universal Vxpx equivale a la conjunción qx, A qx, A... (y la genera- 
lización existencial Jxgx a la disyunción qx, v Qx, V ...), donde las x, recorren todo 
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puede figurar en una proposición a través de sus valores. Como consecuen- 
cia de esto, si dos funciones proposicionales son satisfechas por exactamen- 
te los mismos argumentos, ellas mismas satisfacen exactamente las mismas 
funciones.* La renuncia al Axioma de Reducibilidad invalida, por cierto, 
algunas de las demostraciones del libro. La nueva sección *89 sobre la in- 
ducción matemática (Apéndice B), está destinada a reconstruir las bases de 
la teoría de los números naturales sin Axioma de Reducibilidad. Gódel anota 
un error en la demostración del lema principal *89.16, y concluye por eso 
que “la cuestión de si la teoría de los enteros puede obtenerse sobre la base 
de la jerarquía ramificada debe considerarse como no resuelta hasta la fe- 
cha” (1944, p. 146). En todo caso, aunque se reparara ese error, seguiría 
pendiente la reconstrucción de la teoría de los números reales, que ni siquiera 
se aborda en la segunda edición de Principia. Gódel considera además que 
la práctica de admitir como argumentos de un predicado de funciones, a 
funciones de orden más alto que el predicado mismo —que Russell defiende 
en la nueva Introducción (PM, I, xl y xli) y ejerce profusamente en el Apén- 
dice B— significa que “el principio del círculo vicioso para las funciones 
proposicionales ha sido virtualmente descartado” (Gódel 1944, p. 134). 

En la Introducción citada Russell agradece vivamente la colaboración de 
Frank Ramsey (PM, I, xiti, nota), por lo cual pienso que es posible que la 
vigorosa oposición del joven filósofo al Axioma de Reducibilidad haya con- 
tribuido a la decisión de abandonarlo. Sorprende, empero, que Russell no 
aluda a la clasificación de las paradojas que Ramsey publicó en 1925 y que 
según él hace posible eliminar la ramificación de los tipos (y con ella el 
motivo por el cual dicho Axioma se introdujo). Según Ramsey hay una clara 
diferencia entre paradojas tales como las de Russell, Cantor y Burali-Forti 
(que Russell ya tiene presentes en 1903), y las paradojas de Richard, Berry 
y el mentiroso (que Russell unió a las otras desde su 1906a, probablemente 
influido por Poincaré). Las paradojas del primer grupo “envuelven únicamente 
términos lógicos o matemáticos como clase y número, e indican que tiene 


el universo del discurso. Como señala Gódel (1944, p. 144), esta concepción sólo está 
exenta de dificultades si el número de los individuos y de los predicados primitivos es 
finito. 

ña Russell resume esta conclusión así: “Según nuestra presente teoría todas las funciones 


de funciones son extensionales, es decir, bx =, wx.>.f(9£) = f(yX)” (PM, L, xxxix). 
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que haber una falla en nuestra lógica o en nuestra matemática”; pero las del 
segundo grupo —al cual también pertenece la paradoja de Grelling citada en 
la nota 19— “no pueden formularse empleando sólo términos lógicos, pues- 
to que todas contienen alguna referencia al pensamiento, el lenguaje o el 
simbolismo, que no son términos formales, sino empíricos” (Ramsey 1931, 
p. 20). Para resolver las paradojas del primer grupo basta la jerarquía simple 
de los tipos. La jerarquía ramificada se necesita en Principia Mathematica 
sólo para evitar las del segundo grupo, pero Ramsey muestra que este méto- 
do de solución no es imprescindible. La clasificación de Ramsey ha sido 
generalmente aceptada, y es corriente llamar paradojas sintácticas a las del 
primer grupo y paradojas semánticas a las del segundo. Explicaré esta no- 
menclatura en el Capítulo 3.1, cuando hable de la solución de las paradojas 
semánticas propuesta por Tarski.* 


ae El distingo entre los dos grupos de paradojas está implícito ya en la observación que 


hizo Peano (1906) a propósito de la paradoja de Richard: ella no pertenece a la mate- 
mática sino a la lingúiística. 


2.5 ARITMÉTICA FINITISTA 


En los próximos capítulos examinaré varias contribuciones a la ejecución del 
programa de Hilbert, publicadas antes de que Kurt Gódel pusiera en eviden- 
cia la imposibilidad de llevarlo a cabo conforme a su concepción inicial 
(Gódel 1930a, 1931; cf. Capítulo 2.1, ad finem). Pero antes de abordarlas, 
me referiré al trabajo de Thoralf Skolem, “La fundamentación de la aritmé- 
tica mediante el modo recursivo de pensar” (1923). Aunque fue concebido 
al margen de la escuela de Hilbert, será reconocido por ésta como un para- 
digma de la matemática finita, de los conceptos y procedimientos sustantivos 
a utilizarse en la vindicación del sistema formal de la matemática clásica del 
infinito.! En su Observación Final, Skolem explica que redactó el trabajo en 
1919, después de estudiar Principia Mathematica (Skolem, SWL, p. 187). 
Durante ese estudio se le ocurrió que una buena parte de las matemáticas se 
podía fundamentar sin valerse de generalizaciones universales o existenciales 
con un campo de aplicación ilimitado. Como las paradojas de la lógica y la 
teoría de conjuntos obviamente suponen dicha forma de generalización, al 
evitársela se elude también el complicado aparato adoptado por Whitehead y 
Russell para prevenirlas. Skolem llama la atención sobre la idea de “aseve- 
ración funcional” (Funktionalbehauptung), que atribuye a Whitehead y Russell 
y caracteriza así: “Una aseveración funcional consistirá en afirmar una pro- 
posición (Aussage) como válida en un caso que se deja indeterminado” 
(Skolem, SWL, p. 153).? Con su trabajo se propone mostrar lo siguiente: “Si 


Sobre el distingo entre matemática sustantiva y formal, véanse las citas de Hilbert y 
von Neumann en las pp. 123 y 124, notas 13 y 14. 

A continuación traduzco el pasaje de Principia Mathematica de donde Skolem toma 
esta idea: 


Cuando aseveramos algo que contiene una variable libre (a real variable), en ri- 
gor no cabe decir que estemos aseverando una proposición, pues sólo obtenemos 
una proposición determinada al asignar un valor a la variable, y entonces nuestra 
aseveración sólo se aplica a un caso determinado y no tiene de ningún modo la 
misma fuerza que antes. Cuando lo que aseveramos contiene una variable libre 
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concebimos las aseveraciones universales de la aritmética como aseveracio- 
nes funcionales y nos basamos en el modo recursivo de pensar, dicha cien- 
cia se puede fundamentar consecuentemente sin aplicar los conceptos “always” 
y “sometimes” empleados por Russell y Whitehead” (p. 153, cursiva de 
Skolem). El “modo recursivo de pensar” (rekurrierende Denkweise) consiste 
en valerse libremente de la inducción matemática para la definición de con- 
ceptos y la demostración de teoremas. Combinado con la susodicha idea de 
aseveración funcional, este modo de pensar no deja lugar a dudas. Sea p(x) 
la aseveración funcional que dice que un número indeterminado x tiene la 
propiedad (q. Sea on el siguiente del número n. Si podemos establecer la 
proposición p(1) y la aseveración funcional p(x) > p(0x), podemos eviden- 
temente concluir que p(x). En efecto, como quiera que se fije el número x, 
la conclusión se obtiene mediante una serie finita de aplicaciones de la regla 
modus ponens. Análogamente, para definir una función f con argumentos y 
valores numéricos basta estipular cuál es el número f(1) y cómo se calcula 
f(cx) dado f(x). Entonces podremos determinar el valor de f correspondien- 
te a un número determinado cualquiera mediante una serie finita de aplica- 
ciones de dicho procedimiento de cálculo. Así pues, como Skolem proclama 
con orgullo, su reconstrucción de la aritmética es “consecuentemente finitista” 
y se basa en “el principio de Kronecker según el cual una determinación 
matemática sólo es una determinación efectiva si lleva a la meta al cabo de 
un número finito de intentos (Versuche)” (SWL, p. 188). 

La teoría creada por Skolem (1923) se conoce como aritmética primitivo- 
recursiva y tiene ciertas limitaciones. Como señala van Heijenoort (1967, p. 
302), en ella se puede decir y probar que existen infinitos números primos, 


estamos aseverando una proposición completamente indeterminada, de entre todas 
las que resultan al darle diversos valores a la variable. Es conveniente decir que 
tales aseveraciones aseveran una función proposicional. Las fórmulas matemáti- 
cas corrientes contienen tales aseveraciones; por ejemplo, *sen?x + cos?x = 1” no 
asevera este o aquel caso particular de la fórmula, ni asevera que la fórmula vale 
para todos los valores posibles de x, aunque equivale a esta última aseveración; 
simplemente asevera que la fórmula vale, dejando x completamente indetermina- 
do; y puede hacerlo legítimamente porque, como quiera que se determine x, resul- 
tará una proposición verdadera. 


(Whitehead y Russell, PM, L, p. 18) 
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esto es, que existe, para cada número primo dado x, un número primo z tal 
que x<z<x! + 1; pero no sabríamos expresar que existen infinitos pares de 
primos gemelos —esto es, de la forma (x,x+2)— mediante una fórmula que 
no contenga variables ligadas de recorrido ilimitado. 

El trabajo de Skolem es a la vez largo y conciso y no puedo resumirlo 
aquí. Pero dado el carácter paradigmático que tiene para Hilbert y los suyos, 
es importante que el lector se forme una idea clara de sus métodos, que ilus- 
traré con varios ejemplos. Antes de entrar en materia, Skolem hace algunas 
advertencias que conviene repetir. Ante todo, nos dice que concibe todas las 
funciones como “propiamente descriptivas”. Las funciones proposicionales 
se distinguen sólo porque no admiten más valores que verdadero y falso. 
Específicamente concibe tales funciones descriptivas “como nombres propios 
funcionales, es decir, nombres propios cuya denotación depende de la elec- 
ción de una o más variables”. Según esto, on se concibe como el nombre 
propio de un número, pero de tal suerte que el número así designado varía 
según como se elija el número n.* Advierte además que el signo de igualdad 
(=) entre dos expresiones indica siempre que ambas designan lo mismo; por 
lo tanto, cuando figura entre dos funciones proposicionales expresa —como 
en Frege— la equivalencia de éstas. Por último, anuncia que dará por su- 
puestos los conceptos de número natural y de el siguiente de un número, así 
como el modo recursivo de pensar. 

El $ 1 de Skolem 1923 trata de la adición. La presenta como una función 
binaria definida recursivamente así: [1,] x + 1 = 0x; [11,] x + oy = O(x + y). 
Como Skolem —a diferencia de Peano— no menciona el número 1 entre 
los conceptos que da por supuestos, debemos entender que la estipulación 
[1,] sirve en parte para caracterizarlo como el único número cuya suma con 
un número cualquiera x es el siguiente de x. (La existencia de tal número 
único estaría entonces implícita en la definición de la adición y sería un 
requisito de su viabilidad). La estipulación [i,] autoriza a Skolem a escribir 
“x + 1” por “el siguiente de x” (en vez de ox, una notación que Skolem no 


Skolem comenta brevemente la teoría de las descripciones de Russell, según la cual 
una expresión como “el autor de Waverley” es un símbolo incompleto que nada signi- 
fica por sí solo. Dice que no le parece incuestionable y que, en todo caso, aunque fuese 
correcta aplicada a las descripciones del lenguaje cotidiano, no hay por qué concebir 
de este modo a las funciones descriptivas de la aritmética (SWL, p. 154). 
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utiliza). Así, la estipulación [11,] aparece escrita de este modo: x + (y + 1) = 
(x + y) + 1. Como los conceptos de número natural y siguiente de un núme- 
ro se han dado por supuestos, la estipulación [i,] determina el valor de la 
suma de cualquier número x y el número fijo 1. Por su parte, la estipulación 
[11,] nos enseña a calcular en un número finito de pasos la suma de x y otro 
número cualquiera y, a partir del valor de x + 1 establecido por [i,]. Skolem 
demuestra luego que la adición es asociativa, esto es, que, cualesquiera que 
sean los números a, b y c, a + (b + c) = (a + b) + c. La argumentación se 
presenta con todo detalle como ejemplo típico de una prueba por inducción. 
La estipulación [ii,] relativa a la adición significa que esta ecuación es váli- 
da si c = 1, cualesquiera que sean los números a y b. Supongamos, enton- 
ces, que, cualesquiera que sean a y b, ella vale para un número fijo c. De 
este supuesto se deduce fácilmente que la ecuación vale también si reempla- 
zamos c por el siguiente de c. En efecto, a + (b + ([c + 1)) = a + ((b + Cc) + 
1), según la estipulación [ii,]. Pero a + ((b + c) + 1) = (a + (b + c)) + 1, por 
la misma estipulación [i1,]. Con arreglo a nuestro supuesto, (a + (b + c)) + 
1 = ((a + b)+c<c)+ 1. Pero ((a + b)+c)+1= (a + b) + (c + 1), según la 
estipulación [1i,]. Hilvanando estas ecuaciones, tenemos pues que a + (b + 
(c + 1)) = (a + b) + (c + 1), Q.E.D. El lector que haya visto el Apéndice XI 
reconocerá aquí la demostración de Dedekind. Lo mismo cabe decir del teo- 
rema de conmutatividad de la adición que Skolem demuestra enseguida. 

Luego Skolem define la relación “a < b” (ía es menor que b”), también 
mediante dos estipulaciones: [i_] =(a < D);* y [ii] (a <b +1) o ((a < b) 
v (a = b)). Combinadas con la definición de suma, estas estipulaciones im- 
plican que 1 no es el siguiente de ningún número. En efecto, supongamos 
que n es un número tal que 1 es el siguiente de n. Entonces, en virtud de 
[11], n <n+ 1 = 1; pero esto contradice la estipulación [1_]. Es fácil demos- 
trar la tricotomía: cualesquiera que sean los números a y b, (a< b) v (a = 
b) v (b < a). En vez de (a < b) v (a = b), escribiremos (a < b). Omito la 
definición de la multiplicación y la prueba de que es asociativa, conmutativa 
y distributiva porque —como en el caso de la adición— son prácticamente 
iguales a las de Dedekind (Apéndice XI). 

Para definir la relación “a es divisible por b” —simbolizada D(a,b)— 


4 Uso el simbolismo de nuestro cálculo predicativo (Apéndice IX), en vez de los símbo- 


los lógicos tomados de Schróder que Skolem emplea. 
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Skolem introduce el importante concepto de cuantificación sobre un domi- 
nio acotado. Si p(x) es una aseveración funcional cualquiera y n es un nú- 
mero determinado, en vez de la conjunción Q(1) AQ) A ... A Q(n) escri- 
bimos (Vx<n)p(x) —léase: “para todo x menor o igual que n, p(x)”— y en 
vez de la disyunción q(1) v (A) v ... v ep(n) escribimos (Ix<n)p(x) — 
léase: “hay un x menor o igual que n, tal que q(x)”. Los cuantificadores 
“(Vx<ny y “(Ex<ny ligan variables de recorrido finito y las fórmulas que 
los contienen pueden siempre reemplazarse por la correspondiente conjun- 
ción o disyunción. Su uso no infringe, pues, la decisión inicial de no em- 
plear “siempre” (always) o ía veces” (sometimes) a la manera de Whitehead 
y Russell. La divisibilidad puede ahora definirse sencillamente así: 


D(a,b) £S (1x<aNa = bx) 


A continuación se abordan la subtracción y la división. A propósito de 
ellas, Skolem introduce la idea de función parcial: sí f es una función de 
este tipo, fx designa un cierto número sólo si x es uno de los números perte- 
necientes a un dominio acotado expresamente. Atendamos a sus explicaciones. 
La subtracción se define habitualmente mediante la estipulación (z — y = x) 
£> (z = x + y). Según esto, obviamente, la diferencia z — y no existe si z < 
y, puesto que en tal caso es imposible que z = x + y. Pero puede demostrarse 
que hay un número igual a z — y cuando quiera que y < z. Tradicionalmente, 
este aserto se habria enunciado así: 


—(y < 2) Y IMA + y =2) 


Pero esta fórmula con variables ligadas de recorrido ilimitado se puede aho- 
ra reemplazar con esta otra 


0 < 2 V ÁXSIXA+y=2) 


que Skolem demuestra. La división es objeto de un tratamiento análogo. 
El trabajo culmina en los $$ 6 y 7, donde Skolem, sin recurrir a otros 
medios que los que ha declarado admisibles, define los conceptos de máxi- 
mo común divisor, mínimo común múltiplo y número primo, y demuestra 
que si 1 < x, el número x se puede siempre representar de una y sólo una 
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manera como producto de números primos.* En estos dos parágrafos, Skolem 
a veces define un predicado U(x), para cualquier número x, estipulando las 
condiciones necesarias y suficientes para que [i] U(1) y [11] U(x) dado que 
(Vz<x)U(z). Este procedimiento es característico de la llamada definición por 
inducción transfinita (Apéndice VIII), pero Skolem explica que si x es un 
número natural, tenemos que habérnoslas sólo con una variante de la defini- 
ción recursiva ordinaria. Tenemos, en efecto, que el valor de la función 
proposicional U(Z) A (z < x) para cualquier par de números (x,z) se conoce 
si se conoce el valor de U(z) para z, y que, por otra parte, se sabe si U(z) es 
verdadero o falso para un cierto z < x si se conoce el valor de U(z) A (z < 
x) para ese z y ese x. Por lo tanto, para definir U(x) bastará definir U(Z) A 
< x). El valor de U(zZ) a (z < x) puede definirse por inducción ordinaria. 
Estipulamos primero el valor de U(1). Esto nos da el valor de U(z) a (z < 1) 
para cualquier z, ya que, si z % 1, U(Z) an (<< 1) es falso. Luego suponemos 
establecido el valor de U(z) A (z < n) para cualquier número z, y estipula- 
mos sobre esa base el valor de U(z) an (Z < n + 1) para cualquier z. Ahora 
bien, sin +1<z, entonces =(z € n + 1), de modo que U(z) A (Z<n +1) 
es falso; siz<n + 1, entonces z < n y el valor de U(z) A (Z < n) está ya 
determinado por hipótesis; por lo tanto, sólo hace falta estipular el valor de 
U(z) para el caso en que z = n + 1. En otras palabras, “determinar del valor 
de U(x+1) si esta función se supone conocida para cualquier z < x + 1 equi- 
vale a determinar el valor de la función proposicional U(x) A (z < x) para x 
=n +1 y un número cualquiera z si ya se lo conoce para x = n y un número 
cualquiera z” (SWL, p. 172; he modificado algo la notación de Skolem). 
Skolem también recurre a veces al modo de razonar propio de la induc- 
ción transfinita: De las premisas [a] U(1) y [B] (VZ<JU(A) > U(x), inferir 
[y] UGo. Su utilización en el presente contexto está perfectamente justifica- 


Skolem define la función binaria aAb mediante la triple condición (a = b > aab = a) 
A(b<a>aab =(a-—bjab) an (a<b >aab = aAíb — a)) y muestra luego que 
ab es precisamente el máximo común divisor de a y b. Asímismo, define la función 
avb mediante la condición awb = ab/(aAb) y muestra que awb es el mínimo común 
múltiplo de a y b. Para definir la función proposicional P(x) —léase “x es un número 
primo” — Skolem define una función proposicional binaria que designaré IT(x,y) (Skolem 
utiliza también para ésta la misma letra P). Ésta queda caracterizada por la doble esti- 
pulación siguiente: [i] 11(x,1); [11] lGoy + 1) S (Goy) A (=y +1 v —D(x,y + 1))). 
Entonces, P(x) Y ((G,y) A (x + 1)) 
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da, por cuanto la premisa [$] implica siempre una aseveración que, combi- 
nada con [a], lleva a la conclusión [y] por inducción matemática ordinaria. 
En efecto, si x es un cierto número, la aseveración de que (Vz<x)U(Z) equi- 
vale a la aseveración de que para ese x y cualquier z, (z < x) > U(z). Por lo 
tanto, la premisa [B] (VW2<dU() —> U(o) equivale a ((z < x) > U(D) > 
U(x). Como U(x) > (2 = x) > U(2)), es claro que [(fB] implica que ((z < x) 
> UD) > (U =x) > U(2)), lo cual equivale a (2 <x) > U(Z) > (UZ < 
> UD A =x) > UR). Pero (2 <x) > UD) A ( =x) > UD) 
equivale a ((z < x) v (z = x)) > U(2), y por consiguiente a ((Z<x+ 1) > 
U(z)). Por lo tanto, [$] implica que ((Z < x) > UA) > GU <x+1l)> 
U(z)). Ahora bien, de U(L) y ((Z<x) > UD) > (RU <x+ 1) > U(z) se 
infiere por inducción ordinaria que (z < x) > U(Z) para cualquier número x. 
Reemplazando en este último aserto x por x + 1 y z por x, obtenemos la 
conclusión U(x) por modus ponens. 

Me referiré por último a un teorema intuitivamente obvio que podemos 
enunciar así: Si un cierto número tiene la propiedad U, hay un número que 
tiene la propiedad U y que es menor que cualquier otro que la tenga. Las 
generalizaciones —una existencial y universal la otra— incluidas en la 
apódosis de este enunciado se pueden expresar sin pérdida de información 
mediante cuantificadores de dominio acotado. Para abreviar designo con 
pxU(x) al número más pequeño que tiene la propiedad U (Skolem emplea 
para ello la expresión “Min(U,x)”). Es claro que si hay un cierto número n 
tal que U(n), entonces yxU(x) —si existe— será igual o menor que n. Ade- 
más, para informar que uxU(x) es menor que cualquier otro número z tal 
que U(z) bastará decir que uxU(x) es igual a cualquier z < pxU(x) tal que 
U(z). El contenido del teorema se deja, pues, formular mediante las dos ase- 
veraciones siguientes: 


ti Un) > Ex<nWz<NUW) A (U(Z) > x= 2) 


[11] ((U(a) A (Vx<a«UGO) >x=a) A 
(U(b) A (VySbKU(Y) > y =b)) >a=b 


[1] dice que U(n) implica la existencia de un número que obedece a la descrip- 
ción de uxU(x) y [ti] dice que tal número es único. La aseveración [1] es 
obvia si n = 1. Supongamos, pues, que el teorema es verdad para cualquier 
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n < m y que U(m+1). Caben dos posibilidades: o bien hay un número w < 
m + 1 tal que U(w), y entonces, por hipótesis, x<w<m+11WZ< NU) A 
(U(Z) > x = 2)), de modo que U(m+1) > Ex<m+11(VzZ<xX«U() a (U(2) 
> x= 2)); o bien no hay ningún número w < m + 1 tal que U(w), en cuyo 
caso m+1l = uxU(x) y es claro que U(m+1) > Exesm+DVWVzZ<oNMUC) A 
(UD) > x= 2)). La aseveración [1i] se deduce fácilmente de la tricotomía de 
los números. Si a % b, entonces a<b 0 b< a; pero si b <a es claro que 
(Vx<aKU(x) > x = a) implica —=U(b) y si a < b, (Vy<bXU(y) > y = b) 
implica —U(a). Así pues, a + b implica que la prótasis de la aseveración [11] 
es falsa, de modo que dicha aseveración es verdadera. 


2.6 PRUEBAS DE CONSISTENCIA 


2.6.1 Ackermann (1925) 


La tesis doctoral de Wilhelm Ackermann, “Fundamentación del *tertium non 
datur” mediante la teoría de la no-contradicción de Hilbert”, da testimonio 
de la confianza ciega que Hilbert y sus discípulos tenían en la viabilidad de 
su programa. Se trata de “borrar la fea mancha de las paradojas” del “edifi- 
cio por otra parte tan perfecto de la matemática” y de “salvar partes valiosas 
de la matemática —por ejemplo, la teoría de conjuntos— del escepticismo 
que todo lo aniquila” (Ackermann 1923, p. 1). Con ese fin se propondrá un 
sistema axiomático suficiente para deducir la matemática entera y se buscará 
demostrar su consistencia (Widerspruchsfreiheit). Ahora bien, “las paradojas 
surgen en la matemática sólo allí donde se trata de totalidades infinitas, don- 
de se emplean las palabras “todos” y “existe” y las formas de inferencia 
transfinita —como la “inducción completa” y el “tertium non datur?*— que 
sólo pueden formularse mediante esas palabras” (p. 1). Obviamente, tales 
formas de inferencia deberán evitarse, so pena de circularidad, en las prue- 
bas de consistencia. 


Hilbert evita estas dificultades con su conocido distingo entre matemática 
y metamatemática. La matemática se convierte en un acopio de fórmulas, 
de signos. También lo transfinito tiene aquí su figura visible, finita. La 
metamatemática suministra la prueba de consistencia para la matemática. 
Como la metamatemática sólo hace aseveraciones sobre cosas concretas, 
presentes a la vista, se las arregla enteramente sin inferencias transfinitas. 
Emplea sólo aquellas formas de inferencia primitivas y finitas que admi- 
ten aun los escépticos más tenaces. 

(Ackermann 1923, p. 1) 


Ackermann formula la matemática axiomatizada en un cálculo predicati- 


vo cuyos símbolos lógicos, con una sola excepción que explicaré luego, co- 
rresponden exactamente a los de nuestro Apéndice IX. Para facilitar la lec- 
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tura los reemplazaré, pues, por éstos. Hay variables individuales a, b,c,...; 
variables funcionales n-arias (para cada entero positivo n) f, m,... ; varia- 
bles proposicionales A, B, C; variables predicativas A(a), Bla,b),..., A, fa) 
(donde el subíndice a indica que A depende de la variable funcional f y no 
de su argumento a), ... ; constantes individuales O y 1, y constantes funcio- 
nales. Estas últimas incluyen los símbolos + y x de la adición y la multipli- 
cación, que se escriben entre los signos de los argumentos, y letras minúscu- 
las griegas Q, y,... que simbolizan funciones n-arias (para diversos valores 
del entero positivo n) y se escriben delante del n-tuplo de los argumentos. 
Como variables metalingiísticas —esto es, como parte del alemán en que él 
escribe (o del castellano en que lo explico) — Ackermann usa letras góticas: 
las mayúsculas A, B, €,... representan fórmulas; las minúsculas a, D, c,... 
expresiones de cierto género que, siguiendo a Hilbert, llama funcionales 
(Funktionale). Éstas se pueden caracterizar así: toda combinación sintác- 
ticamente admisible de signos O, 1, +, x y variables individuales es un fun- 
cional; si p es una constante funcional n-aria y (,,..., A, son funcionales, 
entonces Q(1;,..., A, ) es un funcional. Conforme a la tradición iniciada por 
Frege, se adoptan sólo dos reglas de inferencia. La primera es modus ponens: 
de las premisas S y OS > Z inferir la conclusión Y. La segunda es esta 
regla de sustitución: si Y es un axioma y x es una variable cualquiera, infe- 
rir de Y la fórmula que se obtiene reemplazando uniformemente x en 2 por 
un funcional determinado si x es una variable individual, por una cierta fun- 
ción n-aria si x es una variable funcional n-aría, por una fórmula cualquiera 
si x es una variable proposicional del tipo A, B,..., por una fórmula que 
contenga una función 1-aria si x es una variable proposicional del tipo A, 
Ka), etc. 

Los funcionales de la forma 0,0 +1,...,0+1+1+1+l,... se 
llaman numerales (Zahlzeichen). Una expresión que sólo incluya numerales 
y uno o más de los símbolos lógicos =, >, a, v, —, es una fórmula numé- 
rica. Una fórmula numérica de la forma a = b se dice correcta (richtig) si 
a y 6 son numerales iguales; de otro modo se dice incorrecta (falsch). Esti- 
pulamos que, si $ designa una fórmula numérica correcta y ¿Y una incorrec- 
ta, las fórmulas R => HR, FR, YF>V, RaKR RvK, Rv 3, Y v HR 
y 3 son correctas y las fórmulas HR > Y, RAS, FAR FAB AV 
y R son incorrectas. Es claro pues que toda fórmula numérica es correcta 
o incorrecta. No hay otra alternativa. Como subraya Ackermann (1925, p. 4), 
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el tertium non datur tiene aplicación aquí en un sentido finito, intuitivo. 

Ackermann enuncia el siguiente criterio de consistencia: un sistema 
axlomático que emplee el formalismo descrito se reputa consistente si y sólo 
es imposible deducir de sus axiomas la fórmula numérica —(0 = 0). El mé- 
todo propuesto para demostrar la consistencia de un sistema dado 2 puede 
describirse sumariamente como sigue: Sea (A,,..., A,) una lista de fórmu- 
las tales que ?[, es una fórmula numérica y para cada entero positivo k < n, 
91, es un axioma de 2, o se infiere por sustitución de una fórmula que la 
precede en la lista, o se infiere por modus ponens de dos fórmulas que la 
preceden en la lista. Se da una regla para reemplazar por una fórmula numé- 
rica a cada fórmula de la lista que no sea una fórmula numérica. Se muestra 
que aplicando esa regla cualquier lista que cumpla con los requisitos estipu- 
lados se convierte en una lista de fórmulas numéricas correctas. Como la 
fórmula —(0 = 0) es incorrecta y toda deducción de una fórmula numérica 
91, a partir de los axiomas de 2 consiste en una lista (Y[,, .... , A, ) de fórmulas 
que reúne los requisitos indicados, el procedimiento descrito hace evidente 
que la fórmula —(0 = 0) no puede deducirse de los axiomas de 2. Por lo 
tanto, 2 es consistente. 

Los axiomas para la matemática clásica propuestos por Ackermann for- 
man dos grupos: axiomas para la matemática finita y “axiomas transfinitos”. 
Ackermann da una demostración breve pero completa de la consistencia del 
primer grupo y luego bosqueja larga y tortuosamente una demostración aná- 
loga aplicable a todo el sistema. No puedo dar aquí más que algunas indica- 
ciones incompletas sobre esta última. En cambio, presentaré la primera en 
detalle, para que el lector se forme una idea precisa de las intenciones y 
recursos de la metamatemática hilbertiana. (También Ackermann ofrece esa 
demostración sobre todo a título ilustrativo). 

Los axiomas de la matemática finita son 16. Los Axiomas 1-12 bastan 
para deducir por sustitución y modus ponens todas las tautologías; los Axio- 
mas 13 y 14 gobiernan el signo de identidad, y los Axiomas 15 y 16 son 
propiamente aritméticos. Los doy aquí en nuestra notación: 
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1. A>(B>A4) 

Ze (A> (A > B) >(4 > B) 

3. (A > (B > CO) > (B > (A > C)) 
4. (B>0>(U4 > B) > (4 > C)) 
S. AAB)>A 

6. (AnAB)>B 

La A>(B>(AnB)) 

$ A > (A v B) 

9. B>(A v B) 
10. (A> O > ((B > C) > ((A4 v B) > C)) 
11. A> (54 > B) 
127 (A1>B)>(64>B)> Bb) 
13. a=a4 
14, a =b > (Ala) > A(b)) 
13 =(a + 1 =0) 
16. =(a = 0) > (a = S(a) + 1) 


La constante funcional $ utilizada en el Axioma 16 se define recursivamente 
por la doble condición: 5(0) = 0 y O(a + 1) = a. Las constantes + y x se 
definen también recursivamente así: a+0=aya+(b+1)=(a+b)+ 1; 
ax0=0yax(b+1)= (a x b) + a. Ackermann admite que la matemática 
finita se enriquezca indefinidamente con nuevas funciones, siempre que és- 
tas se definan según un esquema de recursión del cual las tres definiciones 
recién citadas son ejemplos sencillos. Dicho esquema se deja formular con 


El tertium non datur, (A v —A), se deduce de los Axiomas 8, 9 y 12 por sustitución y 
modus ponens. En efecto, sustituyendo B por —A en el Axioma 8, obtenemos [a] A > 
(A v —4). Sustituyendo B por —A en el Axioma 9, obtenemos [BP] —4 > (A v 4). 
Sustituyendo B por (A v —4) en el Axioma 12, obtenemos [y] (A > (A v 4) > 
(FA > (Av A) > (A v —4))). Mediante dos aplicaciones de modus ponens a las 
premisas aL, B y y, inferimos (A v 4). 
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toda generalidad así: Considérese una constante funcional n-aria y y funcio- 
nales A(x;,... ,x, 1) y D(X;, - . - ,X,,1) que contienen sólo n — 1 y n + 1 varia- 
bles distintas, respectivamente (n > 1); entonces q se puede caracterizar 
mediante la doble condición siguiente:? 


P0,b,,..- b,1) =0(b,, ... :b,1) 
| (R) 
pla + 1,b,,... b,) = Ha,b,,... ,b, p(a,b,, ... ,b,_1)) 


Demostraré, siguiendo a Ackermann, que la fórmula —(0 = 0) no puede 
deducirse por sustitución y modus ponens de los 16 axiomas de la matemá- 
tica finita, suplementados con definiciones recursivas de constantes funcio- 
nales conforme al esquema descrito. Sea £ = A,,...., Al, una lista de fór- 
mulas que constituye una deducción de la fórmula numérica Y[, a partir de 
dicho sistema de axiomas. Esto supone que, para cada entero positivo k < n, 
%1, es uno de los axiomas 1-16, o se infiere de una o dos fórmulas prece- 
dentes de £ por una de las reglas de inferencia. Supondremos, además, que 
toda fórmula que precede a Y[, en “£ se invoca una y sólo una vez para in- 
ferir otra fórmula de £; por lo tanto, si uno de los axiomas se utiliza para 
deducir r fórmulas de £, £ contiene r copias de ese axioma, y si una fór- 
mula que no es un axioma se aduce en la deducción de otras r fórmulas de 
£, £ contiene r copias de dicha fórmula y de toda la secuencia de fórmulas 
mediante la cual se la deduce de los axiomas. Este supuesto no resta gene- 
ralidad a nuestro argumento, ya que obviamente no cuesta nada darle la for- 
ma por él requerida a cualquier deducción de la fórmula numérica Y, a partir 
de los axiomas 1-16. En virtud del mismo, cada fórmula Y, e £ que no sea 
la última sirve directamente para justificar una única fórmula Y, e L(k<h 
< n) que llamaré la sucesora de Y[, en £. Evidentemente, para que Y, sea la 
sucesora de Yl, tiene que cumplirse una de las dos condiciones siguientes: o 
bien (i) Y, se deduce de A, por sustitución; o bien (ii) hay un índice ¡ tal 
que k% j, k< h,j¡<h y Y, se deduce de Y, y 2, por modus ponens (obvia- 
mente esto sólo puede ocurrir si A, = A, > A, o A, = A, => A. 


Ackermamn expresa el esquema de recursión sólo para los casos n = 1 y n= 2, pero a 
la luz de ellos no cabe duda de que la regla general en que está pensando es la formu- 
lada arriba. 
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Queremos demostrar que Y[,, no puede ser la fórmula —(0 = 0). Para ello, 
como se explicó arriba, vamos a convertir a £ en una lista de fórmulas 
numéricas. Empecemos eliminando las variables. Sea Y[, la última fórmula 
de £ que contiene variables. Como %[, es una fórmula numérica, es claro 
que p <n y que A tiene una sucesora sin variables. Si la sucesora de A, se 
deduce de ésta por sustitución, efectúo la misma sustitución en o (en otras 
palabras, pongo en lugar de Al, una copia de su sucesora). Si la sucesora de 
A, no se deduce de ésta por sustitución, se trata de una fórmula (€ que se 
deduce por modus ponens de premisas Y y Y > €, y A, = Bo A, =V => 
(S. Como E no contiene variables, todas las variables de L, están contenidas 
en la subfórmula YB. Las sustituimos simultáneamente en ambas premisas. 
Como figuran en £ por última vez en AL se las puede reemplazar por ex- 
presiones más o menos arbitrarias: cada variable individual se reemplaza por 
0, cada variable proposicional A se reemplaza por O = 0, cada variable fun- 
cional f(a) se reemplaza por a, cada variable funcional binaria g(a,b) por a 
+ b, etc. y todas las variables individuales así introducidas se reemplazan 
luego por O del modo antedicho.* Al término de estas operaciones, A, habrá 
sido sustituida por una fórmula sin variables 2, y £ por una lista £” cuya 
última fórmula sin variables es A y “on q < p. Repitiendo el mismo proce- 
dimiento un número finito de veces se formará una lista de fórmulas que no 
contienen variables. Para convertirla en una lista de fórmulas numéricas hay 
que eliminar todas las constantes funcionales diferentes de +. Como cada 
constante funcional q tiene que haberse definido recursivamente según el 
esquema antedicho, toda subfórmula sin variables p(...) que comience con 
( se puede traducir mediante un número finito de transformaciones en una 
fórmula numérica 5, tal que p(...) = 5 es una fórmula correcta. Sustitui- 
mos p(...) por $. Como £ es una lista finita de fórmulas finitas, este pro- 
cedimiento se completa en un número finito de pasos, al cabo de los cuales 
habremos obtenido una lista £* de fórmulas numéricas la última de las cua- 
les es Y[,,. Cada fórmula de £* o bien (i) es una copia de una fórmula pre- 
cedente, o bien (11) se deduce de dos fórmulas precedentes por modus ponens, 
o bien (111) se obtiene directamente por sustitución de variables en alguno de 


Aunque Ackermamn no lo dice expresamente, tiene que subentender que O + O se debe 
reemplazar por 0. De otro modo, no se obtendría a fin de cuentas una lista de fórmulas 
numéricas en el sentido preciso del término. 
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los axiomas 1-16. En el caso (1), la fórmula en cuestión será correcta, a menos 
que la precedente que copia sea incorrecta. Es claro asímismo que la con- 
clusión deducida por modus ponens de dos premisas correctas es siempre 
correcta.* Por lo tanto, sólo puede haber fórmulas incorrectas en £* si algu- 
na de las correspondientes al caso (111) es incorrecta. Pero eso no es posible: 
las fórmulas del tipo (111) obtenidas a partir de uno de los axiomas 1-12 son 
siempre correctas, no importa que las fórmulas numéricas que reemplacen a 
cada una de las variables A, B y C sean correctas o no;? y la sustitución de 
variables según las reglas arriba descritas en los axiomas 13-16 sólo puede 
generar fórmulas correctas. Por lo tanto, %l,, la última fórmula de £* y de 
<£, no puede ser la fórmula incorrecta —(0 = 0). 

Antes de seguir adelante, conviene observar que el sistema de la matemá- 
tica finita propuesto por Ackermann, con sus 16 axiomas, sus dos reglas de 
inferencia y su esquema de recursión formaliza justamente la matemática finita 
que Hilbert y sus discípulos sostienen que debe darse por descontada. Es 
claro que la prueba de consistencia ofrecida apela a evidencias y emplea 
modos de razonar propios de esa matemática finita, de modo que en efecto 
supone aquello mismo que pretende establecer. Sirve, pues, a lo sumo, para 
verificar que la formalización es adecuada, que no hemos tenido un traspiés 
al escribir los axiomas con que intentamos representar aquello que está fue- 
ra de duda. Además, por cierto, prepara al lector para la prueba siguiente, 
que emplea los mismos recursos para demostrar la consistencia de un siste- 
ma esencialmente más fuerte. 

Éste comprende, además de todo lo incluido en el sistema anterior, los 
“axiomas transfinitos” que enuncio a continuación:! 


Por definición, las fórmulas Y y A —> Y no pueden ser ambas correctas, a menos que 
la fórmula Y lo sea. 


El lector para quien esto no sea inmediatamente obvio debe comprobarlo construyendo 
tablas de verdad para esos doce axiomas. 


Ackermamn asigna a los axiomas transfinitos los números 1 al 4; sin embargo, me ha 
parecido más razonable numerarlos del 17 al 20, ya que los axiomas 1-16 del sistema 
antes descrito pertenecen también al sistema ahora considerado. Para facilitar la refe- 
rencia he distinguido con subíndices las diversas formas de los axiomas 17-19. Otros 
dos puntos en que mi presentación difiere de la original son los siguientes: expreso la 
negación mediante el signo —, en vez de la tilde y el signo + utilizados por Ackermann, 
y sólo empleo paréntesis redondos, aunque Ackermann también utiliza llaves y corche- 
tes, esto es, los pares £ ) y [ ]. Por otra parte, respeto todos los pares de paréntesis 


2.6 Pruebas de consistencia 226 


1 A(a) > A(e,A(a)) 
17,. A¿ fa) > A,((efA, Kb) a) 
15 Ate, Ala)) > mn, Ala) = 0 

18,. A¿((EfA, F(b)a)) > Ry(A, fa)) = 0 
194. Ate, A(a)) > n,A(a) = 1 

19,. A,((EsA, K(b0)a)) > TACA, fla) = 1 
20. (e, Ala) = 0) 


Como se explicó al comienzo, el subíndice en una expresión como A,f(a) 
indica que la variable proposicional A depende de la variable funcional f, no 
de la variable individual a; la presencia de esta última sirve sólo para indi- 
car que la variable f es 1-aria. Los Axiomas 17,, 18, y 19,, que envuelven 
variables funcionales 1-arias, son propiamente los miembros iniciales de tres 
secuencias infinitas de axiomas análogos que envuelven variables funciona- 
les n-arias, para cada entero positivo n. Por ejemplo, el Axioma 17, se enun- 
ciaría así: 


Va Ay. asb,c) > Ayy(Es Aya pq )ab,c) 


Los operadores e y tr que figuran en los axiomas transfinitos son una inge- 
niosa creación de Hilbert mediante la cual se pueden definir los signos de 
cuantificación Y y 3.7 Ackermamn subraya que “sg y tí son aquí meros signos 


correlativos colocados por él, aunque me parece superfluo el tercer par en el Axioma 
17,, así como el segundo en los Axiomas 18, y 19. 


7 Las siguientes definiciones resumen las ofrecidas por Ackermann (1925, p. 32): 
JUA(u) O Ale, A(u)) 
VuA(u) > Ale, A(u)) 


(aquí, u es una variable individual o funcional). Basándose en ellas, no es difícil dedu- 
cir de los axiomas 1-20 los siguientes teoremas (1925, pp. 32-36): 


VuA(u) > A(u) 
A(u) > JuA(u) 
—VUuA(u) O Ju—A(u) 
Vu—A(u) £S —JuA(u) 
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con los cuales se opera conforme a ciertas reglas” (1925, p. 8). Hay que 
considerarlos, pues, como caracterizados a cabalidad por los axiomas mis- 
mos. Por otra parte, la pretensión de que los Axiomas 1-20 —cuando se los 
suplementa con el procedimiento para la definición de funciones que descri- 
biré luego— bastan para deducir por sustitución y modus ponens toda la 
matemática clásica resulta injustificable e incluso ridícula mientras no se 
explique cuáles son los ingredientes del pensamiento matemático ordinario 
que se quiere representar —o reemplazar— con e y tr. Basándome en lo que 
dice Ackermann, me parece justo explicarlos así: e y í simbolizan funciones 
que asignan un número fijo al predicado escrito a su derecha. El Axioma 
17, requiere que, si hay números a los que se aplica el predicado A, el nú- 
mero designado por e,A(a) sea uno de ellos. Como dice Ackermanmn, “e, A(a) 
designa un número del cual es seguro que satisface la aseveración A(a), si 
es que hay algo que la satisfaga” (p. 8). De otro modo, e,A(a) puede ser 
cualquier número (aunque es recomendable, a diferencia de Ackermann, asig- 
narle un valor determinado de una vez por todas, por ejemplo, e, A(a) = 0). 
El Axioma 17, impone una exigencia similar a la función designada por e; 
A,f(b) en caso que A sea un predicado de funciones. Conforme al Axioma 
20, el predicado A no se aplica en ningún caso al predecesor inmediato del 
número designado por e,A(a). Conforme a los Axiomas 18 y 19, x simboli- 
za una función que asigna a cada predicado el valor O si hay algún número 
(o una función) a que dicho predicado se aplique, y el valor 1 si no lo hay.*? 

La presencia de e y T amplia decisivamente el repertorio de funcionales 
con los que se puede reemplazar una variable de acuerdo con la regla de 
sustitución. Inicialmente Ackermann parece haber contemplado su utilización 
Irrestricta, pues en el texto de su trabajo dice simplemente que “en lugar de 
una variable funcional fía) con un solo hueco, es lícito ahora poner el fun- 
cional e,%(a,b) o también e,%(a,b,c), de modo, pues, que por sustitución en 
una fórmula €, fla) se pueden formar las fórmulas nuevas (,[e,%A(a,b)] o 
€,[s,Ata,b,c)J” (p. 9). Pero en una nota agregada “durante la corrección de 
pruebas”, Ackermann prescribe la restricción siguiente: 


Si hay un número a tal que A(a), entonces A se aplica al número e,A(a) (Ax. 177) y 
por lo tanto, 1,A(a) = 0 (Ax. 18¿). Si no hay ningún número a tal que A(a), tenemos 
que —A(e,A(a)), cualquiera que sea el número e, A(a), de suerte que rr, A(a) = 1 (Ax. 
19,). El lector podrá extender estas consideraciones al caso —gobernado por los Axio- 
mas 18, y 19, (n > 1)— en que A es un predicado de funciones n-arias. 
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No está permitido reemplazar una variable funcional f(a) con un funcional 
a(a) en que a figura dentro del alcance (Bereich) de un ey. Por ejemplo, 
no se puede poner (epa, PYO) en vez de fa), pero sí se puede poner 
(¿BN a) + ,D(a,b). 

(Ackermann 1925, p. %n.) 


Como advierte von Neumann (1927, p. 44), esta restricción es indispensable 
para que la prueba de consistencia ofrecida por Ackermann sea válida, pero 
limita severamente el alcance de la misma: la matemática vindicada por ella 
viene a ser sólo un fragmento de la matemática clásica, equivalente al de- 
fendido por Weyl en El continuo (1918), o a la teoría ramificada de los tipos 
sin Axioma de Reducibilidad. 

También se amplía el esquema para la definición recursiva de nuevas 
funciones. Ahora se admiten como parámetros no sólo las variables indivi- 
duales (como b,,....,b,, , en el esquema R), sino también variables funcio- 
nales, que representen a cualquier función previamente caracterizada, inclu- 
sive e y TT. En vez que expresar esta idea mediante un complejo esquema 
general, prefiero ilustrarla con tres ejemplos tomados de Ackermann. 


Q(0, (0) = a,b) 


(RD) 
py(a + 1, Kb) = by(a, Kb), p.(a, Ko))) 
Qpr(0,8.(b, ACI) = Ay (gb, Ac) 
(R2) 
Q (a + 1,2,(b, fc) = Dyy(a,8.Lb, Kc), yy (ag £d,h(c)))) 
90) = (EALJAONO) 
(R3) 


pj(a + 1) = q(a) + (ELA) + 1) 


La prueba de consistencia del sistema completo sigue esencialmente el mé- 
todo ya descrito, pero, a causa de las novedades introducidas, es muchísimo 
más complicada. Sea £ =A,,..., Y, una lista de fórmulas que constituye 
una demostración (por sustitución y modus ponens) de la fórmula numérica 
Y, a partir de los axiomas 1-20. Supongamos que ya se han eliminado de £ 
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todas las variables libres. Una fórmula de “£ derivada del Axioma 17 por 
sustitución podría entonces ajustarse al patrón siguiente: 


91(0) > A(e Ata) 


donde b es un funcional determinado y %(a) es una fórmula cuya única 
variable libre es a. Naturalmente, tanto b como %(a) pueden contener los 
símbolos e y Tr. Por ejemplo, b podría ser un funcional de la forma 


ele) ¿A ¿DADO 


y Ya) la fórmula e,(a = b) = O. Entonces, la formula en cuestión se repre- 
sentaría más adecuadamente así: 


Ene (Me) E AO EDIADANO) = db) = 0 > eye, (e (a = cc) = 0) = b)=0 


donde YB, € y D representan fórmulas cuya complejidad está apenas insi- 
nuada. Para reducir £ a una lista £* de puras fórmulas numéricas hay que 
eliminar todas las constantes funcionales definidas recursivamente y también 
e y TT. En los casos más sencillos, se puede proceder por “ensayo y error”. 
Consideremos una vez más el patrón A(b) > Ate,M(a)), mas suponiendo 
ahora que e no figura en %(a) y que el funcional b es una fórmula numéri- 
ca. En tal caso, nuestro procedimiento habitual redundará en la sustitución 
de b por cierto numeral 3. Tentativamente, reemplazamos e,Y(a) por O. La 
fórmula resultante %[(3) > %A(0) es correcta a menos que %l(3) sea correcto 
y 21(0) incorrecto, y entonces el propio 3 es un sustituto adecuado para e,Y(a). 

Pero el caso general es muchísimo más complicado. Como subraya Acker- 
mann, con sólo mirar una fórmula no se puede saber de antemano cuántas 
sustituciones de e y Tí habrá que efectuar para que estos símbolos desaparez- 
can del todo. Consíderese, por ejemplo, una expresión como ésta: 


e, Mo e¿B(d),e,£Uc,b)),a)) 
donde la función q se definerecursivamente así: 


py(0, 1h) = A0) 
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p,(a + 1,f(0)) = p,(a, F(b)) + fa + 1) 


Si eg,D(d) se deja reemplazar lícitamente por cierto numeral 3, la expresión 
considerada se transforma en e,o,(3,€ $(c,b)),a)), la cual, mediante la 
definición de (, se reduce a: 


e, MeStc,0) + ¿Ses 1) +... + ESC, 3), a) 


El número de símbolos e que hay que sustituir en esta nueva expresión de- 
pende obviamente del número de unos en el numeral 3. Esta dificultad es, 
por cierto, una consecuencia de la inclusión de variables funcionales como 
parámetros en el esquema de recursión y afecta también, por lo tanto, a 
cualquier constante funcional definida según ese esquema. Si la constante q 
entra en su propia definición recursiva, cuando la reemplacemos con ayuda 
de su definición en una fórmula dada, puede que acabe figurando en la fór- 
mula resultante un mayor número de veces que en la propia fórmula inicial. 

Para establecer que la reiterada sustitución de las funciones que figuran 
en un funcional cualquiera lo transforma en una fórmula numérica al cabo 
de un número finito de operaciones, Ackermann concibe un modo de asig- 
narle a cada funcional un índice característico (formado por varios números), 
define un orden lineal entre esos índices y demuestra que el índice de un 
funcional dado disminuye con cada sustitución prescrita hasta reducirse, tras 
un número finito de ellas, al índice mínimo, característico de las fórmulas 
numéricas. La demostración es tortuosa y no voy a reproducirla aquí (en la 
nota siguiente explico como se construye el índice de un funcional en el caso 
más simple en que éste no contiene los signos e y 1).? Como ya señalé, su 


Para determinar el índice característico de un dado funcional $, en el cual no figuran 
los signos e y Tr, Ackermann tiene en cuenta el orden en que se han definido 
recursivamente las funciones que figuran en 5. Obsérvese que este orden no depende 
del funcional en cuestión sino del modo cómo se ha construido el sistema. En todo 
caso, la primera de esas funciones es la adición. Diré que la función y es mayor o 
igual que la función p si y = q o si q precede a y en dicho orden. Si y y y figuran 
en el funcional $, diré que y está subordinada a q (en 5) si y figura dentro del parén- 
tesis gobernado por q y dentro del alcance de y hay una variable ligada por un subíndice 
de q. Si y está subordinada a y y y está subordinada a (, decimos que y también está 
subordinada a (p. Ackermann asigna a cada funcional un rango con respecto a cada 
una de las funciones que figuran en él. El rango del funcional $ con respecto a una 
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alcance está severamente limitado por la restricción que Ackermann tuvo que 
imponer a su regla de sustitución. 


cierta función (p depende de lo que llamaré el nivel relativo a q de las funciones ma- 
yores o iguales que q que figuran en $. Sea O el conjunto de estas funciones. Si y e 
0 y ninguna función de O está subordinada a y en 5, el nivel de y relativo a p es 1. 
SiyeOyn2les el más alto nivel relativo a q que alcanza una función de Dd 
subordinada a y (en 5), el nivel de y relativo a q es n + 1. El rango de 5 con respecto 
a q es el más alto nivel relativo a p que tiene en 5 una función mayor o igual que q. 
Si q no figura en $ diré que el rango de $ respecto de «p es O (Ackermann no mencio- 
na esta posibilidad, pero hay que tenerla en cuenta para que sea verdad, como él dice, 
que cada funcional tiene un rango con respecto a cada función recursiva). Cada funcio- 
nal $ contiene una colección finita de funcionales que llamaré sus componentes. Por 
ejemplo, los componentes de y,(w,(0 + 1 + 1,p,(e,b)),p,(d,b)) son: O + 1 + L, e, b, d, 
plesb), yL(0 +1 + 1,p,(e,b)), py(d,b) y y Ly 0 + 1 + 1,p,(e,b)),p,(d,b)). Cada com- 
ponente 5, de un dado funcional $ tiene un rango determinado con respecto a cada una 
de las funciones que se han definido recursivamente en el sistema; la lista de estos 
números, dispuesta de modo que las funciones respectivas queden ordenadas de mayor 
a menor, constituye la combinación de rangos de $5, Las combinaciones de rangos de 
los funcionales contenidos en $ se ordenan de mayor a menor según la convención 
siguiente: (a,,...,4,) >(bj,....b) sir>s,osir=s y hay un k (1 < k< r) tal que 
a; < b, pero a;= b; si ¡ < k (nótese que en virtud de las convenciones adoptadas cada 
combinación de rangos contiene el mismo número de enteros no negativos, a saber, el 
número de las funciones que se han definido recursivamente en el sistema). A cada 
combinación presente en la lista le asignamos el número total de veces que figuran en 
$ funcionales que posean esa combinación. Además, asignamos el O a cada posible 
combinación de rangos ausente de la lista que sea menor que la mayor de las presen- 
tes. La lista de números así generada, dispuesta en el orden de las correspondientes 
combinaciones de rangos, es el indice del funcional $. Los índices de distintos funcio- 
nales se ordenan de mayor a menor según la misma convención que aplicamos a las 
combinaciones de rango. Si el funcional $ forma parte de una fórmula numérica tiene 
que ser un numeral, esto es, un 0, o un O seguido de una o más copias de la configu- 
ración “+ 1”. Según nuestras estipulaciones, si 3 es un numeral, él mismo es su solo 
componente y su rango es 1 respecto de la adición y O respecto de todas las otras fun- 
ciones del sistema. Por lo tanto, su combinación de rangos es la mínima, (0,... ,0,1), 
y su índice es el menor de todos, (1). En cambio, si $ no es un numeral, su combina- 
ción de rangos tendrá al menos un entero positivo en una posición distinta de la última 
y su índice, por ende, constará de dos o más números. En las pp. 16-18, Ackermann 
(1925) prescribe sustituciones aplicables a cualquier funcional $ que no sea un nume- 
ral y no contenga variables libres ni los signos e y Tr, las cuales demostrablemente 
generan un funcional de índice más bajo que aquél al que se aplican y lo transforman 
al cabo de un número finito de pasos en un funcional de índice (1). En el resto de su 
trabajo, Ackermann extiende estos procedimientos a funcionales que contengan una o 
más copias de e y T. 
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2.6.2 Von Neumann (1927) 


El escrito de von Neumann “Sobre la teoría hilbertiana de la prueba” (1927) 
trata el mismo tema que Ackermann (1925), pero es mucho más luminoso y 
fácil de leer. El autor formula y clasifica los axiomas de que supuestamente 
puede deducirse toda la matemática clásica de un modo que deja bien claros 
los límites de la prueba de consistencia ofrecida. Ésta no cubre cabalmente 
el sistema propuesto, sino sólo el fragmento que depende de cinco de sus 
seis grupos de axiomas, aunque von Neumann conjetura —con demasiado 
optimismo— que la consistencia de todos los axiomas podrá establecerse con 
el mismo método que aplica con éxito a ese fragmento. Dicho método tiene 
especial interés para nosotros, porque anticipa los utilizados después de 1930 
en el contexto de la llamada teoría de modelos (que estudiaremos en la Par- 
te 3). Antes de explicarlo, me referiré a ciertas observaciones de carácter 
general que von Neumann enuncia en las primeras secciones de su escrito. 

Primero, sobre la “matemática clásica”. Von Neumann entiende por esto 
“la matemática [ ... ] como era universalmente reconocida (allgemein aner- 
kannt) hasta que surgieron los críticos de la teoría de conjuntos: le pertene- 
cen esencialmente todos los métodos de la teoría de conjuntos, pero no la 
teoría de conjuntos abstracta; y, por de pronto, no conoce cardinalidades 
mayores que la del continuo” (p. 256). No sabría identificar con precisión 
ese cuerpo universalmente reconocido de métodos y teoremas matemáticos. 
Me siento inclinado a creer que para von Neumann la “matemática clásica” 
comprendía, por ejemplo, los recursos que empleó Lebesgue en su teoría de 
la integración; pero inmediatamente después de la caracterización citada nos 
advierte que no resolverá, por el momento, si ella incluye o no el Axioma 
de Selección. 

Para probar la consistencia de la matemática clásica hay que formalizar 
con absoluto rigor “todo su aparato de aseveraciones y demostraciones”. Esto 
incluye, por cierto, una formalización de la aritmética elemental o teoría de 
los números naturales. Con todo, “no es posible edificar la teoria de la prue- 
ba a menos que ya esté disponible a priori el número entero positivo con 
todas esas propiedades suyas que se pueden derivar a la manera intuicionista, 
es decir, sustantivamente (inhaltlichy” (p. 258). En otras palabras, la aritmética 
finita a la Skolem (Capítulo 2.5), aunque derivable en la matemática forma- 
lizada, tiene que darse por descontada al emprender la formalización. Ocu- 
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rre, pues, que los mismos conceptos tienen dos modos de manifestarse, (1) 
dentro del formalismo que se investiga y (11) en la reflexión “metateórica” 
acerca de él. Además de los enteros positivos, “todas las relaciones lógicas” 
aparecen bajo esta doble faz (p. 258). Von Neumann reconoce que esto pue- 
de causar confusión (p. 258). 

Von Neumann distingue cinco clases de símbolos simples: variables (consti- 
tuidas por la letra x seguida de un subíndice numérico), constantes (C con 
subíndice), operaciones (O con subíndice y exponente), abstracciones (A con 
subíndice), y signos de puntuación (coma, paréntesis). Operaciones son los 
conectivos lógicos, la identidad, la función “el siguiente de...”, la suma, la 
multiplicación, etc.; el exponente indica “el número de conceptos a los que 
se aplica una dada operación” (p. 259), mientras el subíndice sirve para dis- 
tinguir diversas Operaciones con el mismo exponente (aunque en la práctica 
von Neumann las representa con los signos habituales, por ejemplo, > en 
vez de O,?, = en vez de O,?, etc.). Abstracciones son los operadores que 
ligan variables, esto es, los signos de cuantificación universal y existencial 
(que representaré, como de costumbre, con Y y 3) y el operador 1 (afín al 
operador e que estudiamos en la Sección 2.6.1). Von Neumann da una defi- 
nición recursiva precisa de lo que se llama una fórmula. Ella permite decidir 
en todos los casos si una combinación cualquiera de símbolos simples es o 
no una fórmula. Dada una fórmula, hay siempre un y sólo un modo de cons- 
truirla a partir de una determinada colección finita de símbolos simples, 
mediante un número finito de aplicaciones sucesivas de las reglas que for- 
man la definición de fórmula. Este principio es familiar a cualquiera que haya 
estudiado lógica moderna y está claramente ilustrado en nuestro Apéndice 
IX. Von Neumann subraya su “fundamental importancia”: “un formalismo 
en que no se cumpla sería rechazado por todos como ininteligible e inservi- 
ble” (p. 261). Una fórmula sin variables libres es una fórmula normal. En la 
teoría de la prueba se trata siempre de fórmulas normales (aunque, como es 
obvio, dentro de una fórmula normal q puede figurar una subfórmula y 
que contenga variables libres ligadas por abstracciones que preceden a y en (q). 

En la presentación de von Neumann, la pieza clave de una teoría forma- 
lizada es una regla HR para construir cierto género de fórmulas normales que 
llamaremos axiomas. Y tiene que concebirse de modo que permita decidir, 
en presencia de cualquier fórmula normal, si ésta es o no un axioma. Ki se 
expresa mediante una serie de esquemas. Un axioma es cualquier fórmula 
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obtenida reemplazando por fórmulas normales (o, en algunos casos, por va- 
riables) ciertos elementos de uno de esos esquemas. Por ejemplo, cualquier 
fórmula obtenida reemplazando a. y PB por fórmulas normales en el esquema 
(a > (B > a)) es un axioma según la regla MH característica de la mate- 
mática clásica. En contraste con los sistemas de Frege, Whitehead-Russell y 
Ackermann, tal reemplazo no es aquí una operación del sistema formal — 
una deducción conforme a una “regla de sustitución” — sino un procedimiento 
metateórico, un paso más en la formulación — intrínsecamente interminable — 
del propio sistema. Von Neumann advierte que ese procedimiento “no debe 
confundirse en ningún caso con las operaciones formalistas, pues es un pro- 
ceso sustantivo (inhaltlicher)”: el signo de sustitución —f ¿y en nuestro Apén- 


dice IX (p. 485), Subs ¿Jo en el escrito de von Neumann— “significa” 


algo (1927, p. 264). 
Relativamente a una determinada regla de construcción de axiomas $, una 
fórmula demostrable se define así: 


[D,] Todo axioma es una fórmula demostrable. 

[D,] Si y es una fórmula normal y q y (q > wy) son fórmulas ya reco- 
nocidas como demostrables, entonces y es una fórmula demostra- 
ble. 


Como von Neumann expresamente destaca, esta definición nos enseña a 
construir (aufstellen) fórmulas demostrables, mas no a decidir (entscheiden) 
frente a una fórmula normal dada, si ella es demostrable o no. En esto con- 
trasta con la definición recursiva de “fórmula” que aparece en nuestro Apén- 
dice IX (similar a la de von Neumann). Esto se debe a que, para decidir que 
una cierta fila de signos es una fórmula basta examinar los signos de que 
consta y el modo cómo se combinan, sin que haya que tener en cuenta a 
ningún objeto que no esté dado con ella. En cambio, para determinar que 
una cierta fórmula normal y que no sea un axioma es demostrable, hay que 
conocer una fórmula demostrable q tal que (p —> y) también sea demostra- 
ble, y obviamente el mero examen de y no revela esa fórmula q. 


Parece, pues, que no hay ninguna vía para descubrir el criterio universal 
de decisión (allgemeine Entscheidungskriterium) sobre si una dada fórmula 
normal a es demostrable. Por cierto, actualmente no podemos probar nada 
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a este respecto. No hay tampoco ninguna indicación de cómo podría pro- 
barse dicha indecidibilidad. Pero esta incertidumbre no nos impide cons- 
tatar que hoy en día no es posible decidir universalmente si una fórmula 
normal cualquiera a es demostrable o no (relativamente a la regla de cons- 
trucción de axiomas que se describirá luego). Y que ello sea indecidible 
es incluso la conditio sine qua non para que tenga sentido hacer matemá- 
ticas con los métodos heurísticos de hoy. El día mismo que la indeci- 
dibilidad cese, también dejará de existir la matemática en el sentido ac- 
tual; en su lugar habría una receta completamente mecánica con ayuda de 
la cual cualquiera podría decidir acerca de cualquier aseveración si se la 
puede o no demostrar. 

(von Neumann 1927, p. 266) 


En el formalismo de von Neumann, la fórmula construida anteponiendo 
el operador O,' a una fórmula cualquiera a. se llama la negación de a. Es- 
cribiré —a en vez de O,'a (von Neumann escribe —0). Una regla de cons- 
trucción de axiomas %i se dice consistente si no hay ninguna fórmula nor- 
mal a tal que a. y —a sean ambas demostrables relativamente a HR. La con- 
sistencia de una dada regla % quedará establecida sin lugar a dudas si pode- 
mos definir una partición de todas las fórmulas normales en dos clases con 
las propiedades siguientes: 


[W,] Dada una fórmula normal a siempre es posible decidir, en un nú- 
mero finito de pasos, a cuál de las dos clases pertenece. 

[W,] Ninguna fórmula normal pertenece a la misma clase que su nega- 
ción. 

[W3] Todos los axiomas pertenecen a la misma clase. 

[W,] La fórmula normal (a —> f) pertenece a la misma clase que los 


axiomas si y sólo si la fórmula [fP pertenece a esa clase o la fórmu- 
la a. pertenece a la otra clase. 


Una partición que cumpla estos cuatro requisitos es una valuación (Wertung) 
de %. Como es evidente, en una valuación todas las fórmulas demostrables 
pertenecen a la misma clase que los axiomas. Von Neumann llama a esa clase, 
la clase R (por richtig, *correcto”), pero yo la llamaré V. A la otra clase la 
llamo, con von Neumann, F (falsch, en alemán, significa a la vez “incorrec- 
to” y “falso”). 

Von Neumamn enuncia una regla MR que según él es capaz de generar 
todos los axiomas que hacen falta para deducir toda la matemática clásica 
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(por modus ponens,; cf. la cláusula [D,] de la definición de *fórmula demos- 
trable”). Los axiomas generables con arreglo a MN se clasifican en seis 
grupos. El Grupo Il caracteriza los conectivos lógicos — y > (formalmente, 
O! y O?) y basta para generar o deducir por modus ponens a todas las tau- 
tologías. El Grupo II caracteriza la identidad = (formalmente, O,?). El Gru- 
po III es una versión sin cuantificadores de los cuatro primeros axiomas de 
Peano: caracteriza la constante O (formalmente, C,; léase cero) y los opera- 
dores Z y +1 (formalmente, O,! y O!; Z precede y +1 sigue a su argumen- 
to; léase ...es un número y el siguiente de...). Los tres primeros grupos 
equivalen, pues, a los Axiomas 1-16 de Ackermann. El Grupo VI y último 
es el grupo de las definiciones (para cuya representación formal von Neumann 
ofrece esquemas). Concentraremos nuestra atención en los Grupos IV y V. 

Al Grupo IV pertenece toda fórmula que se obtenga a partir de uno de los 
siguientes esquemas IV,-IV, cuando f es reemplazada por una fórmula nor- 
mal, € por una variable y a. por una fórmula sin otra variable libre que la 
elegida para reemplazar a £, o —trivialmente— por una fórmula normal. 
(Conforme a la convención de nuestro Apéndice IX, 0.g, sería entonces la 
expresión obtenida al sustituir uniformemente la variable que reemplace a € 
por la formula normal que reemplace a f en la fórmula que reemplace a a): 


IV. VEA —> Oye 
IV). Ot, > 350. 
IV5. Oroje > VEO 
IV,. E 


Siguiendo a von Neumann, el sentido del operador 1 se puede explicar así: 
una fórmula a. cuya única variable libre es € representa un predicado que la 
fórmula normal ag atribuye al objeto designado por la expresión f; si hay 
objetos a los que dicho predicado no se aplica, t¿QA designa uno de esos 
objetos; pero sí no hay ningún objeto al que no se aplique el predicado re- 
ferido, T¿Q. designa cualquier cosa. (Como se puede ver, t es simplemente el 
operador complementario o “dual” del operador e utilizado por Ackermann; 
cf. la nota 8). Si t se entiende de esta manera, los esquemas IV, y IV, res- 
ponden a la interpretación familiar de los símbolos —>, VW y 3. Tenemos en 
efecto (1) que el predicado representado por la fórmula a. con variable libre 
ó se aplica al objeto particular designado por t¿a sólo si no hay ningún objeto 
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al que dicho predicado no se aplique (esquema IV), y (11) que si hay obje- 
tos al que se aplique el predicado representado por a, a esos objetos no se 
aplica el predicado representado por =a y t¿]a designa uno de ellos, esto 
es, un objeto al que se aplica el predicado representado por o. (esquema IV). 

Von Neumann observa acertadamente que “los típicos modos de inferen- 
cia “transfinitos” o “impredicativos”” representados por los esquemas del Grupo 
IV no bastan para edificar la matemática clásica. Ello requiere además una 
cierta parte de la teoría de conjuntos. 


Es necesario destacarlo expresamente: Hay dos puntos en que el edificio 
de la matemática clásica está inseguro y expuesto a los ataques de los 
escépticos, a saber, el concepto “todos” y el concepto de “conjunto”. Es- 
tas dos cosas fundamentalmente diferentes no deben identificarse (como 
suele ocurrir), pero tampoco puede permitirse que una de ellas nos haga 
olvidar la otra. La crítica de la matemática comenzó por el concepto de 
“conjunto” y lentamente ha avanzado hasta el de “todos”, que hoy, empe- 
ro, es el principal punto de ataque de los intuicionistas. Pero no hay que 
olvidar que, aun cuando sus objeciones contra “todos” hayan sido refuta- 
das en cierto sentido, con eso no se ha rescatado aún el concepto de con- 
junto. 

(von Neumann 1927, p. 271) 


Conforme al patrón establecido en sus escritos sobre teoría de conjuntos 
(Sección 1.8.4), von Neumann sustituye el concepto de conjunto por el con- 
cepto de función. Introduce un operador binario O (formalmente, 0O,?) tal 
que D(8,n) designa el valor de la función designada por € en el argumento 
designado por n. El Grupo V de axiomas incluye todas las fórmulas que se 
obtengan reemplazando, en el siguiente esquema, € y mn por dos variables 
distintas y a. por una fórmula sin variables libres o cuya única variable libre 
sea la elegida para reemplazar a 1: 


¿Vn(Zn > (O(E,n) = a)) 


Von Neumann explica esto así: VWn(Zn > (D(f,n) = a.)) implica que, cual- 
quiera que sea el objeto c, Zc > (D(f,c) = QA); en otras palabras, la fun- 
ción f representa la expresión a, en el dominio de los números. Por lo tanto, 
lo que el esquema dice es sencillamente que toda expresión está representa- 
da por una cierta función en el dominio de los números. 
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Y ésta es justamente la pretensión de la teoría de conjuntos: Todas las 
aseveraciones sobre x, por compleja que sea su estructura y por intrin- 
cado que sea el modo como x figura en ellas, pueden reducirse a la forma 
normal “x elemento de M”, donde M es independiente de x. Como en vez 
de conjuntos consideramos funciones, en lugar de aseveraciones hallamos 
expresiones, en lugar de la equivalencia lógica la simple identidad y en 
lugar de la forma normal “x elemento de M” la forma normal “valor de la 
función F para el argumento x”. 

(von Neumann 1927, p. 273) 


Como indiqué al comienzo, von Neumann no logra probar la consistencia 
de INK. Sólo prueba la consistencia de MI(I-IV,VD, la regla para la cons- 
trucción de los axiomas de todos los grupos excepto el V. Su prueba, como 
él mismo señala, no va más lejos que la de Ackermann; pero es muchísimo 
más clara y elegante. Von Neumann prepara el terreno con una prueba sim- 
ple y contundente de la consistencia de MR(-IID) (comparable a la prueba 
de Ackermann concerniente a sus Axiomas 1-16). Ella consiste en definir 
una valuación de la regla MHR(1-IID por las siguientes estipulaciones. [i] 
Todas las variables y todas las constantes menos una pertenecen a la clase 
V; la constante exceptuada, que von Neumann escribe informalmente W,, per- 
tenece a la clase F. [11] Si d es una fórmula que consta de una operación n- 
aria y n fórmulas Q;, ...,a, cuya clasificación ya se ha determinado, enton- 
ces [1i,] si b es =a,, des Vsiaues FygesF si ases V; [1i,] si d es (a, > 
A), $ es V si y sólo si 1, es F o a, es V; [112] si d es (a, = 01,), $ es V si 
y sólo si A, y A, SON idénticas; [i1,] si $ es Za.,, $ es V si y sólo si AL, consta 
de un O seguido de ninguna, una o varias copias de la expresión +1”;! [ii] 
si ( no obedece a ninguna de las cuatro cláusulas precedentes, q es V. [111] 
Si q es una fórmula que consta de una abstracción seguida de una variable 
y una fórmula cualquiera, q es V.!! Esencialmente la prueba de consistencia 


Formalmente, esta cláusula se puede expresar con más claridad: [ii] si 4 es Ozla,, 
es V si y sólo si aL, es la constante C,, o consta de C, precedida de una o varias copias 
de Oy), 

Las estipulaciones [iis] y [iii] tienen el efecto de asegurar —trivialmente— la clasifica- 
ción de fórmulas que carecen de toda importancia en la teoría determinada por la regla 
IRA) cuya consistencia se trata de probar. La necesidad de clasificar tales fórmu- 
las desaparece si restringimos el lenguaje de la teoría en cuestión, estipulando que no 
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consiste en establecer que cualquier axioma de los grupos HIII, esto es, cual- 
quier fórmula obtenida por reemplazo a partir de los esquemas característi- 
cos de esos grupos, pertenece a la clase V. Una vez que esto ha sido asegu- 
rado, la cláusula [1i,] garantiza que cada fórmula demostrable es V y la cláu- 
sula [11,] garantiza que la negación de una fórmula demostrable es F y por 
ende no puede ser demostrable. 

Von Neumann señala enfáticamente que no sabríamos dar una valuación 
de MH, ni siquiera de MHR(I-IV). Toda valuación contiene un procedimien- 
to efectivo para clasificar a cualquier fórmula y por lo tanto permite decidir 
en un número finito de pasos si una dada fórmula a es irrefutable (si es 
clasificada como V, en cuyo caso —a tiene que ser F) o indemostrable (si es 
clasificada como F). Aun cuando ello no bastaría para resolver la cuestión 
arriba planteada de si una dada fórmula es o no demostrable, von Neumann 
considera “sumamente inverosímil” que exista un procedimiento universal 
para alcanzar siquiera esta decisión más débil “con respecto a todos los pro- 
blemas matemáticos posibles” (1927, p. 276). Pero aunque la prueba de con- 
sistencia por valuación tenga que confinarse a MR(1-ITD, la consistencia de 
INHA-IV, VD puede probarse mediante lo que von Neumann llama una 
valuación parcial. Y en 1927 von Neumann no ha perdido la esperanza de 
extender este método a MY.'? No puedo entrar aquí en las complejidades 
de su aplicación a fórmulas que contengan cuantificadores o el operador t. 
Pero daré, para terminar, una caracterización general del mismo. 

Sea H una regla para la construcción de axiomas. Una valuación parcial 
de HR es un procedimiento que define, para cada lista finita S de axiomas 
construidos conforme a $ una partición de las fórmulas normales en dos 
clases Vs y Fz con las propiedades siguientes: 


[W,'] Dada una fórmula normal a. siempre es posible decidir, en un nú- 
mero finito de pasos, si pertenece a la clase Vz o a la clase Fa. 


contiene abstracciones, ni más operaciones que las mencionadas en las cláusulas [ii,]- 
[114]. 

Von Neumann 1927, p. 276, n. 8 atribuye a Julius Kónig la idea de probar la consis- 
tencia de la matemática mediante una valuación y a Hilbert las ideas en que se basa el 
concepto de valuación parcial. 
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[W] La fórmula normal a pertenece a la clase Vz si y sólo si =aL per- 
tenece a la clase Fs. 

[Wy/] Todos los axiomas de la lista S pertenecen a la clase Vo. 

[W,'] La fórmula normal (a —> f) pertenece a la clase Vz, si y sólo la 
fórmula f pertenece a la clase Vz o la fórmula a pertenece a la 
clase Fs. 


Como puede verse, toda valuación es a la vez una valuación parcial!* con la 
notable propiedad de que la partición (Vs, Fs) que ella asocia a cada lista 
finita de axiomas S no depende de la índole de S. Una valuación parcial 
corriente no sería tan neutra. Sin embargo, basta dar una valuación parcial 
de KR para estar seguro de que H es consistente. Para demostrarlo, suponga- 
mos que hay una valuación parcial de Hi —que llamaré Wy— pero que HR 
es inconsistente. Esto último implica que hay dos fórmulas normales a y 
=0. que son ambas demostrables relativamente a %. Ahora bien, a la luz de 
las cláusulas [D,] y [D,] de la definición de fórmula demostrable, si a es 
demostrable relativamente a H tiene que haber una lista finita 2, de axio- 
mas construidos con arreglo a %i, tal que, o bien £, tiene un solo miembro 
y ese miembro es a, o bien a. se deduce de los miembros de e mediante 
un número finito de aplicaciones de modus ponens. Otro tanto vale para —a. 
y una lista finita Y_,. Sea £ la unión de las listas £, y Y_, y Va, Fo) la 
partición de las fórmulas normales asociada a £ por la valuación parcial y. 
Entonces, por [Wy'] y [W,'], a y —a pertenecen a la clase V,. Pero esto es 
imposible, por [W»']. Por lo tanto, si hay una valuación parcial de KR, HR no 
puede ser inconsistente. 


da Puesto que, para cada entero positivo k < 4, [W,] implica [W,/]. 
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2.6.3 Herbrand (1931) 


En una nota sobre la “Consistencia (non-contradiction) de los axiomas aritmé- 
ticos” (1929), comunicada a la Academia de París, Jacques Herbrand deslin- 
da con luminosa precisión la teoría axiomática cuya consistencia habría lo- 
grado establecer von Neumann (1927) y esboza un método suyo, más senci- 
llo, para llegar al mismo resultado. Herbrand distingue dos teorías, que lla- 
maré T, y T, (él las llama Th. 1 y Th. 2). Ambas se refieren a objetos 
(individus) llamados números (nombres), entre los cuales hay uno designado 
por la constante “0”. Hay un único predicado *=” (que se escribe entre los 
dos términos a que se aplica) y una “función descriptiva” que asigna a cada 
número a el número designado por 'a + 1”. T, tiene tres grupos de axiomas: 


ll] a=a4, a=b>b=a, a=zbrnb=c>a=c, 
a+1l=b+1loa=b =(a + 1=0) 
pa] Todas las fórmulas de la secuencia 


=(a=a+1) Aa=a+1+1), a=a+1+1+1)... 


qna] Todas las fórmulas que se obtengan reemplazando una letra dada 
por una expresión cualquiera (formada con los medios descritos) 
en los axiomas anteriores o también —como debemos suponer, 
aunque Herbrand no lo diga expresamente— en una tautología!* 
formada con letras y los cinco conectivos =, V, A, +<y +. 


La única regla de inferencia de 7, es modus ponens. La teoría T, tiene los 
mismos axiomas, pero admite el uso de variables ligadas por cuantificadores 
(variables aparentes”, como dice Herbrand). Hemos de suponer que admite, 
además de modus ponens, las reglas para la introducción y manipulación de 
tales variables descritas en lo que Herbrand (1929) llama “nuestra Nota pre- 
cedente” (esto es, Herbrand 1928): reglas de generalización universal y 


ne Esto es, en palabras de Herbrand, una “proposición cuyo valor veritativo (valeur logique) 


es la verdad, cualquiera que sea el valor veritativo de las letras que figuran en ella” 
(Herbrand, EL, p. 21). 
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existencial y las reglas familiares para pasar!'* de —Vxbx a Ix=(x, de xx 
a Vx—=(x, de p v Vxbx a Vx(p v Qx), y de p v Jx4x a Ix(p v (x), O vicever- 
sa. Herbrand observa que la consistencia de 7 es fácil de probar. Luego señala 
que la teoría cuya consistencia von Neumann (1927) demuestra “por un 
método bastante complicado” es precisamente 7». Bosqueja “los fundamen- 
tos de una demostración más simple” y concluye: 


Para completar la aritmética sería menester introducir las definiciones 
recursivas y el axioma de inducción total, cuya consistencia nuestro mé- 
todo —igual que el de von Neumann— no permite demostrar. Hay que 
advertir, sin embargo, que si se introduce solamente el axioma de inducción 
total, sin definiciones recursivas, éste resulta ser una consecuencia de los 
axiomas precedentes y, por lo tanto, no es contradictorio. 

(Herbrand, EL, p. 26) 


La demostración bosquejada en la nota de 1929 se presenta en detalle en 
la tesis doctoral de Herbrand (1930). Su simplicidad se debe justamente a 
que utiliza el principal resultado de esa tesis, el poderoso Teorema de 
Herbrand, cuya demostración, eso sí, es muy complicada. En virtud del mis- 
mo, una fórmula O de T, es demostrable (con los recursos señalados) sólo si 
ciertas fórmulas sin cuantificadores, construibles a partir de Dd según un pro- 
cedimiento que Herbrand especifica, cumplen ciertas condiciones efectiva- 
mente verificables. Como veremos en el Capítulo 2.7, esas condiciones son 
tales que si una fórmula D de T, se halla en el caso descrito es evidente- 
mente imposible que su negación —0 se halle también en el mismo caso. 

Herbrand trata nuevamente el tema de manera más concisa, pero en cierto 
modo más completa y eficaz, en el artículo póstumo “Sobre la consistencia 
de la aritmética” (1931) que terminó en Góttingen el 14 de julio de 1931, 
trece días antes de caer a un precipicio en el macizo de Pelvoux (tenía vein- 
titrés años). Allí vindica la observación final arriba transcrita, mediante el 
invento genial que examinaremos ahora. Herbrand considera ahora una teo- 


“Regles de passage” es como Herbrand llama (en otros escritos) a las próximas cuatro 
reglas y sus inversas. Enuncia también otras, que envuelven los conectivos A y >. El 
deseo de ser breve explica —pienso— la omisión de estas últimas en Herbrand 1928, 
a pesar de que en ese escrito se acepta como primitivo el conectivo > (escrito >, 4 
la Russell), además de — y v. 
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ría que llamaré T,, formalizada como 7, y T, en un cálculo predicativo de 
primer orden con sólo una constante (0), un predicado diádico (=) y un functor 
primitivo (+1). T;, retiene los axiomas del grupo l, llamado aquí Grupo A, 
pero en lugar del grupo II se introduce el siguiente Grupo B (esquema de 
“inducción total”): 


[B] Si O(x) representa una fórmula que contiene la variable libre x, 
entonces la fórmula construida según el esquema siguiente es un 
axioma: 


(D(0) A VA(D() > Dx + 1) > VxD(x) 


Un tercer grupo de axiomas [C] consiste en las ecuaciones requeridas para 
definir un número arbitario pero finito de functores k-arios (para uno o más 
enteros positivos k). Con respecto a esas ecuaciones, Herbrand sólo estipula 
que (1) no pueden contener variables ligadas, (11) permiten “calcular efectiva- 
mente” el valor de la función respectiva para cualquier lista idónea de nú- 
meros (k números cualesquiera, si el functor es k-ario), y (111) se puede “de- 
mostrar de modo intuicionista”!% que el valor así calculable está bien deter- 
minado en cada caso.!” 

El último grupo de axiomas de 7, autoriza la deducción de generalizacio- 
nes mediante la siguiente estipulación: 


Cf. la definición de esta expresión por Herbrand citada en la p. 125, nota 15. Designa 
precisamente los métodos sustantivos (inhaltlich), finitistas, de la metamatemática 
hilbertiana. 


Herbrand no define aquí el concepto de cálculo efectivo, pero da dos ejemplos: (1) Si 
a y B son, respectivamente, un término y un functor 1-ario previamente definidos, puede 
introducirse un nuevo functor f caracterizado por las ecuaciones f(0) = a y f(x + 1) = 
B(R0. Q) Si los términos a y b y las funciones (x,y) > x + y y x>x-— 1 han sido 
previamente definidos, se puede introducir un nuevo functor 3-ario (p caracterizado por 
las ecuaciones q(0,a,b) = a + b, p(x,a,1) = a y 0(x + 1,a,b) = p(x,a,o(x + 1,a,b — 1)). 
En el Capítulo 2.11 nos ocuparemos con este tema del cálculo efectivo de funciones 
numéricas. Como allí veremos, la primera definición precisa del concepto (Gódel 1934), 
equivalente a todas las que se han propuesto más tarde, se inspiró en una comunica- 
ción privada de Herbrand a Gódel. 
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[D] Si QD(x) representa una fórmula sin variables ligadas, tal que, cuan- 
do se la considera sustantivamente (esto es, como enunciando una 
propiedad de los enteros y no como un mero símbolo), se puede 
probar mediante “procedimientos intuicionistas” que D(x) es ver- 
dadera para todo x, entonces VxQD(x) es un axioma. 


La teoría T, así caracterizada es por lo menos tan fuerte como la aritmé- 
tica clásica. Herbrand no pretende haber demostrado su consistencia y reco- 
noce que, a la luz del teorema recién publicado por Gódel (1931), bien pue- 
de ser imposible demostrarla.'% Su prueba de consistencia vindica sólo cier- 
tos fragmentos de la aritmética, más amplios en todo caso que el vindicado 
por Ackermann (1925) y von Neumann (1927). Sus resultados pueden for- 
mularse así: 


(1) La teoría determinada por los Grupos A, B, C y D es consistente si 
las fórmulas P(x) a que se refiere el Grupo B no contienen varia- 
bles ligadas. 

(2) La teoría determinada por los Grupos A, B, C y D es consistente 
aunque las fórmulas P(x) a que se refiere el Grupo B contengan 
variables ligadas, si dichas fórmulas no contienen ningún functor 
de los definidos en el Grupo C (en otras palabras, si el único functor 
que figura en ellas es el functor 1-ario “+1” caracterizado por los 
dos últimos axiomas del Grupo A). 


Para lograr estos resultados, Herbrand se vale de la ocurrencia que arriba 
llamé genial y que ahora paso a explicar. Consiste en definir, para cada fór- 


Entiéndase, con los métodos que él llama intuicionistas (veáse arriba, nota 16, y Capi- 
tulo 2.1, nota 14). La siguiente observación con que termina Herbrand (1931) se enten- 
derá mejor una vez que hayamos estudiado el descubrimiento de Gódel en el Capítulo 
2.10: 


No es imposible que todo razonamiento intuicionista pueda representarse (se faire) 
en una aritmética con los axiomas A y B, sin admitir en C más que la adición y 
la multiplicación ordinarias. De ser así, aun la consistencia de la aritmética ordi- 
naria sería indemostrable. 

(Herbrand, EL, p. 232) 
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mula D(x) a que se refiere el Grupo B (sin restricciones) una función e con 
la siguiente propiedad: si a es el número más pequeño tal que D(a) es falsa, 
e(x) = 0 cuando x < a y e(x) = a cuando x > a. La definición rigurosa de e 
está dada por el siguiente Grupo E de esquemas (el lector debe verificar que 
la función e aquí definida tiene en efecto la propiedad indicada): 


[E1] e(0) =0 
[E2] (D(0) a =d(x+1)1€0)=0) > e(x+1)=x+ 1 
[E3] (D(0) a =D(x + 1) a E()=0) > e(x + 1) = e(x) 
[E4] e)=y+1>ey+1)=y+11€p9)=0 


Mediante un razonamiento tan simple como brillante, Herbrand demuestra 
que el esquema de inducción total B es una consecuencia de El-E4. Supon- 
gamos, en efecto, que cierta fórmula D(x) satisface las condiciones E1-E4, 
pero que el respectivo esquema B es falso. Esto último significa suponer que 
D(0) y VX(D(x) > D(x + 1)) son verdaderas, pero que hay un número x tal 
que —Q(x + 1). En tal caso, E2 y E3 implican que e(x+ 1) =x+l si e(x) 
=0 y e(x + 1) = e(x) sí e(x) + 0. Así pues, en cualquier caso, e(x + 1) 4 0, 
de modo que hay un número y tal que e(x + 1) = y + 1. Por lo tanto, en 
virtud de E4, e(y + 1) = y + 1 y e(y) = 0. Esto implica que e(y + 1) 4% e(y). 
De esta desigualdad y E3 se infiere (por modus tollens) que (D(0) A —D(y 
+ 1) n e(y) = 0) y por ende que —Q(y + 1). Supusimos inicialmente que 
Vx(D(x) > D(x + 1)) es verdadera, lo cual implica que Vu—D(x + 1) => 
—0(x)). Concluimos, por lo tanto, que —DP(y), de modo que y + O. Hay, pues, 
un número z tal que y = z + 1. Tenemos que e(z + 1) =e(y)=0%2z+1. De 
esta desigualdad y E2 se infiere (por modus tollens) que _D(0) A =D(Z + 
1) a g(z) = 0), lo cual, combinado con E3, permite concluir (por modus 
ponens) que e(z) = e(z + 1) = eg(y) = 0. Por otra parte, como D(0) y —D(z 
+ 1) —o sea, —D(y)— son verdaderas, (D(0) An —D(z + 1) n e(z) = 0) 
implica que e(z) + O. ¡Contradicción! Es claro, entonces, que el Grupo E 
puede sustituir al Grupo B. 

Si las fórmulas DP(x) a que se refieren los Grupos B y E no contienen 
variables ligadas, los esquemas El1-E4 caen según Herbrand dentro del Gru- 
po C, “pues en ese caso se puede constatar efectivamente si D(x) es o no 
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verdadera y las hipótesis E permiten calcular efectivamente los valores e(x) 
de modo unívoco y no contradictorio” (EL, p. 228). Para establecer el resul- 
tado (1) basta entonces probar la consistencia de los grupos A, € y D. Como 
se verá en el próximo capítulo, ello no es difícil, una vez se dispone del 
Teorema de Herbrand. También el resultado (2) es una consecuencia fácil de 
ese teorema. 


2.7 EL ENTSCHEIDUNGSPROBLEM 
Y EL TEOREMA DE HERBRAND 


El programa de Hilbert busca vindicar la matemática clásica con métodos 
finitistas o “intuicionistas”! a través del estudio de su formulación en una 
escritura conceptual o cálculo lógico, como el CP1= de nuestro Apéndice 
IX, o el que utilizan Whitehead y Russell. Tales cálculos tienen una propie- 
dad que resulta ser importantísima para ese propósito: para decidir si un objeto 
cualquiera es un signo del cálculo, si una fila de tales signos es una fórmula, 
o si una lista de fórmulas es una prueba (de la última fórmula de la lista a 
partir de una o más de las anteriores) basta efectuar un número finito de 
operaciones simples, cada una de las cuales arroja un resultado inequívoco e 
indubitable. Por ejemplo, para decidir que $ no es un signo de nuestro CP1= 
basta compararlo con cada uno de los 10 signos del mismo; para establecer 
que una lista (0.;,... ,0,) de fórmulas de la teoría T, de Herbrand 1929 (Sec- 
ción 2.6.3) es una prueba de a., a partir de los axiomas [IT], [11] y [MM] de 7, 
basta determinar, con respecto a cada fórmula a, (1 < k < n) de la lista, que 
aL, es un axioma o es idéntica a la subfórmula y de una fórmula a, = (Pp > 
Y), donde h < k y P = 0 para algún índice j < k. La índole intuitiva y ruti- 
naria de tales métodos de decisión recuerda los familiares algoritmos para 
calcular la suma, el producto, el mínimo común múltiplo, etc., de una lista 
de enteros. Como veremos en el Capítulo 2.11, aquí no hay sólo un pareci- 
do, sino una afinidad esencial. Usaré por eso el término genérico “algoritmo” 
para referirme a cualquier procedimiento como esos. La noción es algo ne- 
bulosa, pero en el Capítulo 2.11 veremos que hay varios modos (equivalen- 
tes) de hacerla precisa. Diré que un cálculo lógico K es efectivo si hay un 
algoritmo para decidir si una lista de objetos es una prueba en K (lo cual 
supone, claro está, que haya algoritmos para decidir si un objeto cualquiera 
es un signo, una fórmula o un axioma de K). 


Sobre el uso hilbertiano del adjetivo “intuicionista”, vide supra, p. 125, nota 15. 
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Porque el cálculo de Whitehead y Russell es efectivo, sus propiedades se 
pueden estudiar ““metamatemáticamente” con métodos “intuicionistas”. Como 
las teorías fundamentales de la matemática clásica se dejan representar en 
él, Hilbert concibió la esperanza de demostrar la consistencia de esas teorías 
a través de la investigación metamatemática de su representación en el cál- 
culo. Bastaba establecer que una fórmula dada —por ejemplo, la que repre- 
senta la desigualdad O 4 0— no puede ser la última fórmula de una prueba 
a partir de los axiomas de la teoría investigada. Obviamente, el problema 
quedaría resuelto si hubiera un algoritmo para decidir, ante una fórmula cual- 
quiera, si ella es o no deducible de los axiomas. La efectividad del cálculo 
no garantiza que tal algoritmo exista. Si el cálculo es efectivo es posible, 
claro está, determinar en un número finito de pasos si cierto despliegue de 
signos que termina con la fórmula en cuestión obedece o no a las reglas que 
que gobiernan las pruebas. Pero otra cosa muy distinta es decidir con me- 
dios finitos si en el conjunto infinito de las pruebas posibles hay o no una 
que termine con esa fórmula. 

En los años veinte empezó a usarse el vocablo alemán Entscheidungs- 
problem (“problema de la decisión”) para designar, por antonomasia, este 
último problema. Formulémoslo con un poco más de precisión. Sea T una 
teoría matemática representada en un cálculo efectivo K. Sea 4 la clase de 
fórmulas de K que son axiomas de T. Sea a. una fórmula de K. Decimos que 
a es deducible de 4 en K —simbólicamente, 4 yz a— si hay una lista £ 
de fórmulas de K tal que [i] a es la última fórmula de £ y [ii] si fB es cual- 
quier fórmula de £, o bien PB e «A, o bien f se infiere conforme a una de las 
reglas de inferencia de K de fórmulas que preceden a fB en £. Un procedi- 
miento de decisión (Entscheidungsverfahren) para T es un algoritmo que 
permita decidir, en el caso de cualquier fórmula a. de K, si 4 Hz aL o no. El 
Entscheidungsproblem de la teoría T' consiste en hallar un procedimiento de 
decisión para 7. Como luego explicaré, Post (1921) resolvió positivamente 
el Entscheidungsproblem para el llamado cálculo proposicional, que es un 
pequeño fragmento del sistema de Principia Mathematica. Animados en parte 
por este éxito y también, sin duda, por la índole puramente combinatoria de 
la construcción de pruebas en un cálculo efectivo, varios seguidores de Hilbert 
creyeron que podrían hallar un procedimiento de decisión para el fragmento 
mayor (correspondiente a nuestro CP1=) que juzgaban suficiente para re- 
presentar la matemática clásica. Vimos en la Sección 2.6.2 que von Neumann 
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(1927, p. 266), con característica sagacidad, expresaba dudas con respecto a 
la viabilidad de este proyecto, y no hay indicios de que Hilbert mismo se 
haya interesado por él.? En cambio, para el joven Herbrand ese era “el proble- 
ma fundamental de la lógica matemática” (EL, pp. 64, 170), “en cierto modo, 
el problema más general de las matemáticas” (EL, p. 210). Si no hubiera 
creído que podía resolverlo, difícilmente habría llevado adelante la endiabla- 
da demostración del teorema que lleva su nombre y que todavía sirve de 
base a la solución positiva del Entscheidungsproblem en los casos especiales 
en que ésta es posible (cf. Dreben y Goldfarb 1979). 

Antes de seguir adelante, debo señalar que la definición de *procedimien- 
to de decisión” que he dado aquí, ajustándome a las formulaciones de 


Antes bien, en su importante artículo “Sobre lo infinito”, Hilbert da por descontado 
que no puede haber un método general —no digamos un algoritmo— para resolver 
todos los problemas matemáticos. Tras reiterar su convicción de que en la matemática 
no hay problemas insolubles, agrega: “Por cierto, mi teoría de la prueba no puede in- 
dicar en general una vía por la cual todo problema matemático pueda resolverse: tal 
vía tampoco existe” (1925, p. 180). 

La última frase está tomada del resumen de la tesis doctoral de Herbrand, redactado 
por él mismo y publicado sin firma en los Anales de la Universidad de París en 1931. 
Vale la pena leer el párrafo completo que la precede: 


Russell mostró en Principia Mathematica que para hacer matemáticas se puede 
usar, en vez del lenguaje ordinario, una suerte de estenografía, de lenguaje simbó- 
lico que utiliza sólo un número muy limitado de signos [ ... ], cuyas combinacio- 
nes forman las frases. Pero fue más lejos y eso es lo que nos importa: mostró que 
todas las demostraciones matemáticas posibles dependen de unas cuantas reglas 
simples de razonamiento que él enuncia; que en toda teoría matemática determi- 
nada se comienza por admitir como verdaderas ciertas proposiciones —los axio- 
mas de esa teoría— que se traducen en combinaciones de signos; que todas las 
demostraciones que se pueden hacer en la teoría se reducen al empleo sucesivo de 
ciertas reglas bien determinadas que permiten fabricar nuevas proposiciones ver- 
daderas a partir de proposiciones ya reconocidas como verdaderas, y que, si se 
traduce toda la demostración al lenguaje simbólico, estas reglas pueden enunciarse 
como reglas para determinadas combinaciones de los signos de este lenguaje. Así 
vemos, pues, que el problema “¿Puede tal proposición demostrarse en una teoría 
que tiene tales axiomas?” es un problema concerniente a los signos de este len- 
guaje y sus combinaciones, y que es susceptible de un tratamiento matemático. 
Esa es la forma más general del problema que los alemanes llaman el “Ent- 
scheidungsproblem”. Es, en cierto modo, el problema más general de las matemá- 
ticas. 

(Herbrand, EL, pp. 209-10) 
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Herbrand (y a las demandas del programa de Hilbert), difiere de la que doy 
en el Apéndice IX. Según ésta, un procedimiento de decisión para un cálcu- 
lo lógico es un algoritmo para determinar la validez —no la deducibilidad— 
de sus fórmulas. Como ambos conceptos se entrelazan en la historia que voy 
a relatar, conviene distinguirlos mediante prefijos: *v-” para validez, *d-” para 
deducibilidad.* A un hilbertiano de estricta observancia tiene que importarle 
la d-decisión, que se refiere a una propiedad sintáctica de las fórmulas, inde- 
pendiente de su posible significado, y no la v-decisión, que se refiere a una 
cuestión semántica, concerniente al significado y la verdad.? Sin embargo, 
los dos trabajos más importantes dedicados al Entscheidungsproblem en la 
revista de Hilbert (Behmann 1922, Bernays y Schónfinkel 1928) lo caracte- 
rizan exclusivamente en términos de v-decisión. Aún más llamativo es el 


Más adelante, encontraremos un tercer concepto de decisión, en el título y en el texto 
del célebre artículo de Gúdel, “Sobre proposiciones formalmente indecidibles de Prin- 
cipia Mathematica y sistemas afines” (1931). Sea K un cálculo lógico efectivo con un 
signo de negación que representaré con —. Sea R una relación n-ádica entre números 
naturales (n > 1). R es decidible en K en el sentido de Gódel 1931 si K tiene una 
fórmula con n variables libres p(€;,....8,), tal que Y Fx d(a//Ej,... ,Q,/E,) Si 
QL¡, » - - ,0,, SON los nombres en K de una lista de números que tiene la relación R y Y 
Ex =Q(01/E;, . . . ,A,/E,) Si OL], -  - ,, Son los nombres en K de una lista de números 
que no tiene la relación R. (La notación $(0.,/8;,... ,QL,/E,) se explica en el Apéndice 
IX, p. 485). Conviene advertir que Gódel no es enteramente responsable de esta con- 
fusión terminológica. En la definición que acabo de parafrasear, donde —como todos 
los traductores — digo “decidible”, el original no dice “entscheidbar”, sino “entscheidungs- 
definit”, que propiamente significa “determinado con respecto a la decisión”. Como Gódel 
estaba indudablemente familiarizado con los conceptos de v-decisión y d-decisión arri- 
ba explicados y con el llamado Entscheidungsproblem, cabe pensar que con la palabra 
“entscheidungsdefinit” no quiso decir *decidible” —en una nueva y caprichosa acep- 
ción— sino “determinado con vistas a (o para los efectos de) la d-decisión”. Pero Gódel 
usa invariablemente “unentscheidbar” (“indecidible”) para calificar las relaciones que no 
son entscheidungsdefinit —así como las proposiciones que las aseveran— hasta en el 
mismo título de su trabajo. 


Como incisivamente advierte Kleene (1952, p. 175), “la noción misma de validez no 
es finitista (finitary) en el caso de un dominio infinito y una fórmula que contenga [un 
predicado n-ádico]. Pues supone que el valor de una función sea [0] para todas las 
funciones lógicas de n variables consideradas como valores de ese predicado, y la cla- 
se de tales funciones lógicas es indenumerable y por ende sólo es concebible (como 
solemos pensar) en términos del infinito actual”. (Los corchetes marcan dos pequeños 
cambios que he introducido en el texto de Kleene para ajustarlo a nuestro Apéndice 
IX). 
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hecho de que tanto Post como Herbrand, que ponen sus miras resueltamente 
en la d-decisión, la abordan, como veremos, con lo que en el fondo son 
métodos de v-decisión, que sirven al interés declaradamente sintáctico de estos 
autores porque ocurre que se ocupan con cálculos en los que toda fórmula 
válida es a la vez deducible. 

El concepto semántico de fórmula válida definido en el Apendice IX (para 
el CP1= y el CP2=) es, por cierto, posterior a estos trabajos: lo introdujo 
Tarski en un escrito que apareció en polaco en 1933, en alemán sólo en 1935 
(Capítulo 3.1). Pero un concepto análogo está implícito ya en los argumen- 
tos con que Frege justifica los axiomas y reglas de inferencia de su cálculo 
BS (1879) y figura destacadamente en la obra de Schróder (VAL, 1890ss.), 
quien, inspirándose en Boole y sobre todo en Peirce, fundó en Alemania otra 
tradición de lógica matemática.? Esa tradición culmina en el articulo de 
Leopold Lówenheim, “Sobre posibilidades en el cálculo de relativos” (1915). 
Dicho artículo, que por su simbolismo obsoleto nos resulta hoy casi ilegible, 
fue estudiado acuciosamente por Skolem, Herbrand y Gódel. Contiene la 
primera versión del célebre Teorema de Lówenheim y Skolem. Rompiendo 
el orden cronológico, dejo su estudio para el Capítulo 3.2, porque la obra de 
Tarski a que se refiere el Capítulo 3.1 nos ayudará a entender mejor el punto 
de vista semántico presupuesto en la concepción misma del teorema. Pero 
debo dar aquí algunas indicaciones sobre dicho punto de vista, pues Gúdel 
lo adopta en las investigaciones que estudiaremos en los Capítulos 2.8 y 2.10, 
y el propio Herbrand, cuya ortodoxia hilbertiana le impedía adoptarlo, lo 
explota como un recurso metódico. 

Para no fatigar al lector con el aprendizaje del simbolismo de Lówenheim, 
evitaré citar sus fórmulas.” Éstas son ecuaciones, casi siempre de la forma D 
=060= 1, donde Y es una expresión que contiene variables, que pueden 
ser de distintos tipos. En las ecuaciones de primer orden? —las únicas a que 


En cambio, en Principia Mathematica el concepto de validez brilla por su ausencia. 


La nota introductoria a la traducción inglesa de Lówenheim 1915 en van Heijenoort 
1967 contiene indicaciones sobre el “cálculo de relativos” de Peirce-Schróder que bas- 
tan para descifrar ese escrito y los escritos tempranos de Skolem. 


Lówenheim las llama “ecuaciones numéricas” (Zahlgleichungen). El nombre que les 
doy corresponde al utilizado en la traducción inglesa de Lówenheim 1915 citada en la 
nota precedente. Se justifica porque toda ecuación numérica en el sentido de Lówenheim 
puede expresarse mediante una fórmula de nuestro cálculo predicativo de primer orden 
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voy a referirme aquí— las variables son de un solo tipo y recorren un mis- 
mo dominio de objetos (Denkbereich, “universo del discurso”), no vacío pero 
por lo demás indeterminado, que Lówenheim, siguiendo a Schróder, llama 
1!. Dependiendo de su estructura, Dd denota una clase de n-tuplos de objetos 
de 1! o expresa una aseveración sobre tales objetos o clases. El significado 
del signo “1” a la derecha de la ecuación depende de la índole de la expre- 
sión OD a la izquierda: si ésta nombra una clase de n-tuplos, 1 es la clase de 
todos los n-tuplos posibles; pero si D es una aseveración, “PD = 1” expresa 
que O es verdadera. O es en todo caso el complemento booleano del 1 per- 
tinente: la clase vacía, si 1 es una clase; “lo falso”, si 1 es una aseveración. 
Como es obvio, una ecuación que en cierto dominio de objetos se cumple 
(vale, está satisfecha) como quiera que se fijen los valores de sus variables, 
puede no cumplirse en otro dominio. Una ecuación satisfecha en todo caso, 
cualquiera que sea el dominio 1!, es una ecuación idéntica. Lówenheim lla- 
ma Fluchtgleichung —digamos ecuación huidiza— a una ecuación que no 
es idéntica, pero que se cumple en cada dominio finito, como quiera que se 
fijen los valores de sus variables; y llama Haltgleichung —diré ecuación 
detenible— a una ecuación que falla para alguna asignación de valores a sus 
variables en un dominio finito.? Evidentemente, la clasificación de las 
ecuaciones en idénticas, huidizas y detenibles es una partición. 

El Teorema 2 de Lówenheim (1915) dice que toda ecuación huidiza de 
primer orden falla para alguna asignación de valores a sus variables en un 
dominio enumerable. Este es el enunciado original del célebre teorema ge- 
neralizado más tarde por Skolem.'% Pero en el presente contexto nos interesa 


CP1= y toda fórmula del CP1= puede representarse mediante una ecuación numérica 
en el sentido de Lówenheim. 


La idea que inspira esta curiosa terminología me parece ser la siguiente. Podemos tra- 
tar de refutar la validez universal de una ecuación examinando si se cumple en domi- 
nios de 1,2,3,... objetos. Si ella es una Haltgleichung este proceso se detiene con 
algún entero positivo n; pero en el caso de una Fluchtgleichung el proceso continúa 
indefinidamente a pesar de que la ecuación no es universalmente válida. Así, la ecua- 
ción huidiza es una que logra escapar a la refutación que sin embargo merece. 


La formulación habitual del Teorema “ascendente” de Lówenheim-Skolem generaliza 
el siguiente corolario, derivado por contraposición del enunciado anterior: si una ecua- 
ción de primer orden está satisfecha —como quiera que se fijen los valores de sus 
variables— en un dominio enumerable y en cada dominio finito, esa ecuación es una 
ecuación idéntica. 
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más el Teorema 4. Digamos que una ecuación de primer orden es unaria si 
contiene expresiones que denotan clases de objetos de 1', pero no contiene 
ninguna expresión que denote, para algún n > 1, una clase de n-tuplos de 
tales objetos. Tales ecuaciones pueden evidentemente representarse en aquel 
fragmento del CP1= que no contiene predicados poliádicos. Este fragmento 
del CP1= (o de otro cálculo lógico equivalente o análogo) suele llamarse 
cálculo de predicados monádicos. El Teorema 4 dice que ninguna ecuación 
unaria es huidiza. Esto significa que toda ecuación unaria es detenible o 
idéntica. La demostración —que Lówenheim solamente bosqueja— provee 
un método constructivo que permite establecer, con respecto a cada ecua- 
ción unaria en que figuran k predicados monádicos diferentes, o bien que 
ella es idéntica, o bien que no está satisfecha para alguna asignación de 
valores en un dominio de 2* objetos. Tal método constituye en efecto un 
procedimiento de v-decisión para el cálculo de predicados monádicos. El 
Teorema 4 de Lówenheim (1915) constituye pues la primera solución posi- 
tiva parcial —avant la lettre— del Entscheidungsproblem (en sentido 
semántico, es decir, como problema de la v-decisión).'' 

La tesis doctoral de Emil Post, “Introducción a una teoría general de las 
proposiciones elementales” (1921) plantea explícitamente y resuelve el pro- 
blema de la d-decisión con respecto a una parte del sistema deductivo de 
Principia Mathematica. Dicha parte comprende precisamente lo que en la 
jerga de nuestro Apéndice IX llamaríamos fórmulas verifuncionales y los 
axiomas que consisten en fórmulas de esa clase. Su nombre tradicional es 
cálculo proposicional, porque se entiende que los predicados 0-ádicos (““va- 
riables proposicionales”) que figuran en tales fórmulas representan proposi- 
ciones indeterminadas.'? Siguiendo a Whitehead y Russell (PM, *1), Post 


Así lo entiende Behmann en su escrito “Contribuciones al álgebra de la lógica, espe- 
cialmente al Entscheidungsproblem” (1922). La principal contribución que ahí se ofre- 
ce es precisamente el Teorema 4 de Lówenheim 1915, reformulado como solución al 
problema de la v-decisión del cálculo de predicados monádicos. Behmann da una de- 
mostración detallada y relativamente clara, basada en la de Lówenheim; pero aún más 
clara es la elegante demostración de Bernays y Schónfinkel (1927) que presento en el 
Apéndice XIV. 

El rechazo filosófico de la idea misma de proposición inspiró luego el nombre sentential 
calculus que suele, curiosamente, vertirse al castellano como “cálculo sentencial”, qui- 
zás porque la palabra “oración” —equivalente exacto de la inglesa 'sentence”— tiene, 
además de su significado gramatical, uno religioso (la alergia a la connotación paralela 
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llama “proposiciones elementales” a las fórmulas de este cálculo, pero como 
aquí hemos reservado el adjetivo “elemental” para sus ingredientes inana- 
lizables (que otros llaman “fórmulas atómicas”), las llamaré, como de cos- 
tumbre, “fórmulas verifuncionales? o simplemente “fórmulas” (si no hay pe- 
ligro de confusión). Post adopta un punto de vista decididamente sintáctico: 
estudia el cálculo proposicional de Principia y ciertas generalizaciones del 
mismo exclusivamente como objetos formales (“as purely formal develop- 
ments” —p. 266).!* Sus resultados “conciernen a la lógica de las proposicio- 
nes pero no están incluidos en ella” (p. 265). Esta observación anticipa el 
distingo hilbertiano entre los razonamientos formales, que la metamatemática 
estudia, y los razonamientos sustantivos (inhaltlich), que ella practica; pero, 
en contraste con Hilbert, que quería rebatir el intuicionismo con los limita- 
dos recursos que éste admite, Post está dispuesto a aprovechar “cualquier 
instrumento de la lógica y la matemática que [encuentre] útil” (p. 266).!* 
La descripción del cálculo proposicional, organizado como sistema de- 
ductivo, está contenida en cuatro postulados. El Postulado I da la regla para 
construir nuevas fórmulas a partir de una o dos fórmulas dadas. Los Postu- 
lados Il y II dan reglas para obtener nuevos asertos a partir de uno o dos 
asertos dados. El Postulado IV despliega los asertos primitivos. Conviene 
advertir que las mismas letras minúsculas p, q, r, con o sin subíndices nu- 
méricos, que Whitehead y Russell usaban como variables del cálculo 
proposicional (el equivalente de nuestros predicados O-ádicos), Post las uti- 
liza como parte del idioma de trabajo (o sea, como “letras esquemáticas” o 
“variables metalingiísticas”) para representar variables proposicionales cua- 
lesquiera, y también, aparentemente (en el Postulado I), para representar 
fórmulas cualesquiera. Por otra parte, usa bien decididamente las mayúscu- 


habría operado, quizás, en la otra dirección si entre los profesores de filosofía de habla 
castellana fuese mayor el número de ex-penados y no tan grande el de ex-seminaristas). 


Para “una formulación general de este punto de vista”, Post remite al capítulo VI de la 
obra de C. IL. Lewis, Survey of Symbolic Logic (1918), desgraciadamente omitido en la 
reimpresión de 1960. Leemos allí que “un sistema matemático es cualquier conjunto 
de filas de signos reconocibles (strings of recognizable marks) en el cual algunas filas 
se adoptan inicialmente y las demás se derivan de ellas mediante operaciones ejecuta- 
das conforme a reglas que son independientes de cualquier significado asignado a las 
signos” (p. 355; en el original, este pasaje está destacado en cursiva). 


Como veremos en el Capítulo 2.8, Gódel 1930 adoptará una postura metódica similar. 
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las P y Q para representar fórmulas indeterminadas (en el Postulado III). 
Como es habitual, Post usa los conectivos del cálculo para nombrarlos al 
discurrir sobre éste.!* El cálculo proposicional de Principia Mathematica tiene 
dos conectivos primitivos, — y v, en términos de los cuales se definen estos 
tres: D, + y =. Post usa estos cinco signos como en ese libro, pero aquí los 
reemplazaré por =, V, >, A y +, respectivamente. Por lo demás, usaré li- 
bremente la jerga de nuestro Apéndice IX. Para la puntuación usaré parénte- 
sis en vez de los sistemas de puntos que Post imita de Principia. Post se 
vale del signo fregeano + prefijado a un esquema de fórmulas para indicar 
que cualquier fórmula construida según ese esquema es una aseveración 
(assertion). Entiendo que este signo no pertenece al cálculo, sino al discurso 
sobre el cálculo. 

A continuación enuncio los postulados con que Post caracteriza el cálculo 
proposicional de Principia Mathematica. 


I Si p y q son fórmulas verifuncionales (elementary propositions), =p 
y (p v q) son fórmulas verifuncionales.'? 
TI Si una aseveración f contiene una variable del cálculo p, y q y r 


son variables del cálculo, también es una aseveración la fórmula 
verifuncional obtenida al reemplazar p por q, o por —q, o por (q v 
r) en todas las posiciones que p ocupa en ft. 


TI Si P y O son fórmulas verifuncionales tales que FP y HAP v 0), 
entonces FO. 

IV HE( V p) v p), Hp y (q v 1) v (a y (p Y D), 
Hg y (p y 9), EEE Y 1) Y E v q) y (o v 1), 


EE y q) v (q v p).” 


Por ejemplo, cualesquiera que sean las fórmulas representadas por las letras p y q, la 
expresión *(p v q)” representa la fila de signos formada por el paréntesis izquierdo, 
seguido de la fórmula representada por p, seguido del signo de disyunción, seguido de 
la fórmula representada por q, seguido del paréntesis derecho. 

Post escribe “p v q”, sin los paréntesis, que introduce luego sin estipulación previa en 
los esquemas de fórmulas más complejas. Pero el uso de los paréntesis tiene que regir- 
se por un postulado, igual que el uso de los conectivos, aunque más tarde se autorice 
su eliminación —informal— si no hay riesgo de confusión. 

Salvo por la sustitución de símbolos arriba descrita, reproduzco fielmente el Postulado 
IV de Post (p. 267). El lector poco familiarizado con la lógica moderna lo entenderá 
mejor si reemplaza cada fila de la forma (a v fB) por una de la forma (a —> PB). 
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El teorema fundamental demostrado por Post acerca del cálculo propo- 
sicional establece la condición necesaria y suficiente para que una fórmula 
del conjunto definido mediante el postulado I “sea aseverada (asserted) en 
virtud de los postulados II, [II y IV” (1921, p. 269), esto es —en la termino- 
logía del Apéndice IX— para que sea deducible de los axiomas (IV) confor- 
me a las reglas de inferencia por sustitución (II) y modus ponens (1). La 
demostración de este teorema descansa en una interpretación algebraica de 
las fórmulas del cálculo (o de los esquemas con que Post los representa—no 
sabría decir cuál de estas dos alternativas es la que tiene presente; para no 
distraer al lector me referiré expresamente sólo a la primera). Dicha inter- 
pretación consiste sencillamente en esto: cada fórmula representa una opera- 
ción algebraica sobre un dominio que contiene dos objetos. Post los designa 
con los signos *+* y *-”, pero yo usaré los signos “0” y *1”. Como es habitual 
en este género de representaciones, las letras representan los argumentos de 
la operación. Así, una fórmula con n variables proposicionales diferentes re- 
presentará una aplicación de (0,1)” en (0,1). Como cabe esperar, la aplica- 
ción —:(0,1) — (0,1) se define por la doble condición —0 = 1, —=1 =0, y 
la aplicación v:£0,1P? —= (0,1) por la cuádruple condición (0 v 0) = (0 v 1) 
= (1 v0)=0 y (1 v 1) = 1. Cada fórmula del cálculo proposicional (o cada 
esquema) representa entonces alguna aplicación q: (0,1$” — (0,1) definida 
por composición (generalmente repetida) de éstas dos. Post demuestra el 
teorema siguiente: Toda aplicación q: (0,1)" — (0,1) está representada por 
una fórmula.'* Diremos con Post que una tal aplicación es positiva si su valor 
es idénticamente O en todos sus argumentos (recuérdese que Post escribe “+” 
en vez de “0”), negativa si su valor es idénticamente 1 (*-”), y mixta si ad- 
mite ambos valores. Esta partición de las operaciones algebraicas sobre (0,1) 
se extiende naturalmente a las fórmulas que las representan. Digamos con 


La demostración es muy fácil de seguir si escribimos (p A q) —0, como Post, p-g— 
para abreviar “(=p v —q). En tal caso, la aplicación a: (0,132 = (0,1) queda defini- 
da por las ecuaciones (01 0)=0,(01 1)=(11.0)=(1 1 1) = 1. La demostración 
procede por inducción sobre el número de argumentos n. Hay cuatro aplicaciones tales 
que n = 1, representadas, respectivamente, por (p v p), (p Y Pp), (p V —p) y —p. 
Supongamos que el teorema vale si n= k y que f aplica (0,1++! en (0,1). Es fácil ver 
que Fi. >> > Pro) = (Pg a Fi +++ PO) Y Par 0 AP + PO), donde f, 
y f, son aplicaciones de (0,134 en (0,13 y por ende están representadas por fórmulas, 
conforme a la hipótesis inductiva. 
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Post que una fórmula a. está contenida en un fórmula f si a. se deriva de f 
por una o más aplicaciones de la regla de sustitución II. Post demuestra que 
toda fórmula contenida en una fórmula positiva (negativa) es positiva (nega- 
tiva) y que toda fórmula mixta con n variables diferentes contiene al menos 
una fórmula representativa de cada operación n-aria. La condición necesaria 
y suficiente para que una fórmula verifuncional sea aseverada en virtud de 
los postulados Il, UI y IV es que ella sea positiva. Es muy fácil demostrar 
que esta condición es necesaria: un cálculo rápido muestra que cualquier 
fórmula construida según los esquemas del postulado IV es positiva; ya se- 
ñalamos que toda fórmula derivada por sustitución de una fórmula positiva 
es positiva, y es evidente que toda fórmula derivada por modus ponens de 
dos fórmulas positivas es positiva. Para demostrar que la condición es sufi- 
ciente, Post establece un método general para derivar la aseveración Fa de 
cualquier fórmula positiva a. En otras palabras, Post nos da lo que se llama 
una demostración constructiva: no se limita a probar en abstracto que cada 
fórmula positiva es deducible por II y III de los axiomas IV, sino que enseña 
“un método para escribir inmediatamente una derivación formal de su ase- 
veración basada en los postulados” (1921, p. 271; en cursiva en el original). 
La demostración de Post, relativamente simple, será el paradigma de otras 
más complejas. La reproduzco en el Apéndice XV. 

Como la positividad o no positividad de una fórmula puede establecerse 
computando el valor de la operación respectiva para cada asignación de va- 
lores a sus argumentos, el teorema fundamental de Post resuelve el proble- 
ma de la d-decisión para el cálculo proposicional. Pero su significación no 
se limita a eso. Como el lector se habrá dado cuenta, las fórmulas positivas 
según la interpretación algebraica son precisamente las fórmulas válidas se- 
gún la interpretación lógica familiar presentada en el Apéndice IX.'” Por lo 
tanto, al establecer que una fórmula verifuncional es deducible de los postu- 
lados II, HI y IV si y sólo si es positiva, Post ha demostrado que el sistema 
deductivo descrito es a la vez correcto y completo, esto es, que toda fórmula 


Post mismo nos lo hace presente cuando introduce su interpretación algebraica del 
cálculo proposicional con estas palabras: “Denotaremos el valor veritativo de cualquier 
proposición p con + si es verdadera y con — si es falsa. Conviene tener en vista este 
significado de + y — como una guía del pensamiento, pero en la exposición siguiente 
deben considerarse meramente como símbolos que manipulamos de cierta manera” 
(1921, p. 267). 
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deducible es válida y toda fórmula válida es deducible (Apéndice IX.F).2 
Por esta razón, cualquier procedimiento de v-decisión —como el conocido 
método de las tablas de verdad utilizado en efecto por Post— constituye a la 
vez un procedimiento de d-decisión. Post establece además que el cálculo 
proposicional tiene la siguiente interesante propiedad: cualquiera que sea la 
formula a, o bien a es deducible, o bien —a es deducible. Un sistema de- 
ductivo que posea esta propiedad —puramente sintáctica— suele llamarse 
completo en el sentido de Post.?! Si A es el conjunto de todas las fórmulas 
deducibles en un sistema completo en este sentido y a. es cualquier fórmula 
que no pertenece a A, entonces A U Laf es inconsistente (puesto que —AL € 
A). Por lo tanto, un sistema deductivo completo en el sentido de Post no 
puede fortalecerse sin engendrar contradicciones.” 


en Es oportuno señalar que Bernays, en su Habilitationsschrift inédito de 1918, había 


establecido que un sistema deductivo equivalente al considerado por Post es completo 
en el sentido indicado (toda tautología verifuncional es deducible de sus axiomas). 
Bernays 1926 es una versión abreviada de ese trabajo. 


al Conviene observar que el adjetivo “completo” (complete) no se usa así en Post 1921. 


Allí, un “sistema completo” es un cálculo proposicional en que “every truth system 
has a representation”, esto es, uno cuyos conectivos primitivos bastan para representar 
todas las aplicaciones de (V,Fy” en £V,F) para cualquier n > 1 (p. 273; véase arriba, la 
nota 18). En cambio, un sistema consistente, completo en el sentido de Post, en Post 
1921 se llama “closed”, cerrado (p. 277). 


La mayor parte de la tesis doctoral de Post (1921) se consagra a generalizaciones del 
cálculo proposicional. Aunque caen fuera del tema de esta sección, diré aquí breve- 
mente de qué se trata. Post considera generalizaciones de tres tipos: por variación de 
los conectivos primitivos, por variación de los postulados y por variación del número 
de objetos (“valores veritativos”) contenidos en el dominio de la interpretación 
algebraica. Con respecto al primer tipo, conviene identificar los sistemas cuyos 
conectivos primitivos permiten representar el mismo conjunto de operaciones algebraicas 
sobre (0,1); Post remite a un trabajo futuro en el cual promete demostrar que hay 66 
sistemas diferentes cuyos conectivos primitivos son unarios, binarios y ternarios, y que, 
si admitimos conectivos primitivos n-arios con n > 4, se generan ocho familias infini- 
tas de sistemas (cf. Post 1941); luego establece las condiciones que debe reunir los 
postulados de un sistema capaz de representar todas las operaciones sobre (0,1) para 
que dicho sistema sea completo en el sentido de Post. A propósito del segundo tipo de 
generalización, Post estipula que llamará “inconsistente” a cualquier sistema en que 
sea deducible la variable proposicional p. El tercer tipo de generalización concierne a 
las llamadas “lógicas polivalentes”; Post ve una analogía entre el dominio de la inter- 
pretación algebraica de un cálculo proposicional y el espacio de una geometría, 
específicamente, entre la numerosidad de aquél y el número de dimensiones de éste; 
ella motiva la aguda observación siguiente: 
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En los próximos años Post trabajó intensamente en una teoría general de 
los sistemas formales (cálculos lógicos) con miras a resolver el problema de 
la d-decisión para el sistema entero de Principia Mathematica. Hacia 1924 
se convenció —mediante un argumento “diagonal” como el utilizado por 
Turing (1937)— de que la solución tenía que ser negativa. Pero no publicó 
nada.2 Por ese mismo tiempo, jóvenes matemáticos europeos, privados de 
la luz que podría haberles proporcionado un contacto siquiera verbal con su 
colega americano, acometían el Entscheidungsproblem con un entusiasmo dig- 
no de mejor causa. Concentraré mi atención en la obra de Herbrand, que 
constituye en cierto modo el ne plus ultra en esta materia. Su máximo logro 
es el Teorema de Herbrand a que he aludido un par de veces. Bernays (1954) 
lo llama “el teorema central de la lógica de los predicados”. La tesis docto- 
ral de Herbrand, Investigaciones sobre la teoría de la demostración (1930), 
está entera dirigida a probarlo. No es posible reproducir la prueba aquí: 
larguísima ya en la versión defectuosa del autor, ha crecido todavía más con 
las correcciones de Dreben y sus colaboradores.?* Pero vale la pena explicar 


Mientras el espacio intuitivo de puntos con mayor número de dimensiones tiene 
tres, el espacio intuitivo de proposiciones con mayor número de dimensiones tie- 
ne dos. Pero tal como podemos interpretar intuitivamente los espacios geométricos 
de mayor número de dimensiones usando un elemento distinto del punto, inter- 
pretaremos los espacios de mayor número de dimensiones de nuestra lógica to- 
mando como elemento algo que no sea la proposición. 

(Post 1921, p. 281) 


za Mucho más tarde, Post redactó un largo informe sobre sus investigaciones de ese pe- 


ríodo, al que incorpora extractos de sus notas, para documentar cómo había anticipado 
los grandes hallazgos de Góúdel, Church y Turing a que me refiero en los Capítulos 
2.10 y 2.11. Dicho informe fue publicado póstumamente en la antología The Undecidable 
editada por Martin Davis (1965). 


Dos de las proposiciones auxiliares que Herbrand utiliza en su prueba y alegadamente 
demuestra son, en efecto, falsas: el decisivo lema del $ 3.3 y el Lema 3 del $ 5.3 
(Herbrand 1930, cap. 5). Dreben, Andrews y Aanderaa 1963 dan contraejemplos que 
ponen su falsedad en evidencia. Dreben 1963 enuncia un nuevo lema con que reempla- 
zar al del $ 3.3. Una versión corregida del argumento de Herbrand se bosqueja en 
Dreben, Andrews y Aanderaa 1963a y Dreben y Anderaa 1964. Dreben y Denton 1966 
dan una demostración detallada del lema sustituto. La admirable versión inglesa de los 
escritos de Herbrand editada por Goldfarb (Herbrand LW) contiene varias notas —en 
parte redactadas por Dreben— que explican claramente este asunto. Las notas de Dreben 
se publicaron ya con la traducción inglesa del capítulo 5 de Herbrand 1930 en van 
Heijenoort 1967. 
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el significado del Teorema. 

Como vimos en la Sección 2.6.3, Herbrand considera teorías axiomáticas 
expresables en un cálculo predicativo de primer orden esencialmente igual a 
nuestro CP1= (las diferencias son muy superficiales y aquí las pasaré por 
alto). El enfoque es estrictamente sintáctico: aunque Herbrand habla de 
propositions, las caracteriza como filas de signos, por lo cual me parece jus- 
to llamarlas *“fórmulas”.2 El cálculo está organizado como un sistema deduc- 
tivo equivalente al sistema de primer orden de Principia Mathematica. Una 
fórmula verdadera (vraie) o identidad es una fórmula deducible de los axio- 
mas conforme a las reglas de inferencia. 

En una fase preliminar, Herbrand considera solamente fórmulas compues- 
tas de letras minúsculas (propositions-éléments, correspondientes a nuestros 
predicados O-ádicos y a las “variables proposicionales” de Whitehead y 
Russell), los conectivos — y v, y signos de puntuación, esto es, lo que en el 
Apéndice IX.C llamo fórmulas verifuncionales. Con ellas organiza un siste- 
ma deductivo equivalente al definido por los Postulados I-IV de Post. Las 
fórmulas deducibles en este sistema son “identidades de la primera especie”. 
Herbrand asocia a cada letra minúscula lo que llama un “valor lógico”, con- 
sistente en una de las dos letras mayúsculas V y F. El valor lógico de una 
fórmula compuesta exclusivamente de variables proposicionales, conectivos 
y signos de puntuación depende de los valores lógicos asignados a sus va- 
riables proposicionales, según reglas que ya nos son familiares. Herbrand tam- 
bién designa los valores lógicos con las palabras francesas vrai y faux (*ver- 
dadero” y “falso”), lo que puede ocasionar confusión con el uso de vraie en 
la acepción de “deducible en el sistema”. Herbrand demuestra, como Post, 
que una fórmula verifuncional es deducible en el cálculo proposicional de 
Principia Mathematica si y sólo si su valor lógico es V cualquiera que sea 
el valor lógico asignado a las minúsculas componentes. 

Herbrand pasa luego a ocuparse con su tema principal, el cálculo predica- 
tivo de primer orden con identidad, que, para mayor claridad, identificaré 
con la versión máxima de nuestro CP1= (con — y v como únicos conectivos 
“oficiales”). Forma este cálculo como una extensión del anterior, agregándo- 
le los signos de cuantificación y de igualdad y secuencias infinitas de (1) 


“Una colección (assemblage) de letras, signos y puntos formada a partir de los signos 
“= y v conforme a las reglas precedentes y a las que se verán en 1.4 se llama una 
proposición” (Herbrand 1930, cap. 1, $ 1.3; EL, p. 44; cf. p. 72). 
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variables individuales, (11) constantes individuales, (111) predicados n-ádicos, 
para cada n > 1 y (iv) functores n-arios, para cada n > 1. Herbrand trata a 
las fórmulas sin variables individuales que este cálculo hereda del anterior 
como “predicados con O términos” (fonctions propositionelles á O argument— 
EL, pp. 59f.; el lector reconocerá aquí la fuente de nuestra expresión “predi- 
cado 0O-ádico”). Una proposition élément consta de un predicado seguido del 
número apropiado de variables. Me permitiré llamarla fórmula elemental, 
como en el Apéndice IX. Por su parte, Herbrand llama propositions 
élémentaires a las fórmulas compuestas de propositions éléments y que no 
contienen cuantificadores; pero a estas fórmulas —que Herbrand también 
describe como fonctions propositionelles de premiere espece— yo las llama- 
ré matrices. Los componentes elementales de una matriz son las distintas 
fórmulas elementales que figuran en ella. Llamaré valuación de una matriz a 
la asignación arbitraria de un “valor lógico” Vo F a cada uno de sus com- 
ponentes elementales; cada valuación confiere obviamente un “valor lógico” 
determinado a la matriz misma, computable por el procedimiento de las ta- 
blas de verdad. 

Si admitimos como axiomas a todas las fórmulas construidas sustituyen- 
do letras por fórmulas elementales en los esquemas del Postulado IV de Post, 
el teorema relativo a las identidades de la primera especie se extiende natu- 
ralmente a las matrices: una matriz se deduce de dichos axiomas por susti- 
tución y modus ponens si y sólo si su valor es V en todas sus valuaciones. 
En tal caso, decimos con Herbrand que la matriz es una identidad de la pri- 
mera especie con respecto a sus componentes elementales (obviamente, una 
matriz u tiene esta propiedad si y sólo si u es una tautología en el sentido 
del Apéndice IX.C). Como esta propiedad es decidible mediante un algorit- 
mo, Herbrand se desentiende de los axiomas tradicionales del cálculo 
proposicional y adopta como axiomas del cálculo de primer orden todas las 
matrices cuyo valor sea V en cualquier valuación. No admite otros axio- 


Ss “Les propositions élémentaires qui, considérées comme des fonctions propositionelles 


de premiere espece de leurs propositions-éléments, sont des identités de premiere espece 
seront vraies” (Herbrand 1930, cap. 2, $ 2.2,; EL, p. 63; cursiva en el original). Se 
advertirá que esta clase de fórmulas es más estrecha que la de las tautologías, definida 
en el Apéndice IX.C, pues comprende sólo aquéllas de entre éstas que no contengan 
cuantificadores. Por ejemplo, la tautología (VxPx w —VxPx) no es un axioma según la 
estipulación citada. 


2.7 El Entscheidungsproblem 262 


mas. Adopta las siguientes reglas de inferencia: 1% modus ponens; 2* la regla 
de simplificación: de (f v Q), deducir q; 3* las reglas de generalización —si 
d(x) contiene la variable libre x, de d(x) deducir Vxb(x) o 3yb(x,y), donde 
d(<,y) es cualquier fórmula obtenida reemplazando x por y en una o más 
posiciones libres de x en Q(x); 4” las reglas de transición (réegles de passage) 
que autorizan a sacar un cuantificador del alcance de un conectivo o a po- 
nerlo dentro de él (conforme a los esquemas (4), (5), (8) y (9) del Apéndice 
XIID. Herbrand da por supuesto que las variables ligadas son intercambia- 
bles;?” específicamente, una variable € se puede reemplazar por otra variable 
cualquiera € en todas las posiciones en que £ esté ligada por un cierto 
cuantificador en una fórmula q, siempre que € no figure libre dentro del 
alcance de ese cuantificador ni esté ligada en q por otro cuantificador cuyo 
alcance incluya posiciones de la variable que se quiere reemplazar. Pero 
Herbrand no postula expresamente una regla de inferencia a este efecto. 

Herbrand dice que “el problema fundamental de la lógica matemática con- 
siste en hallar un procedimiento que permita siempre reconocer si una fór- 
mula (proposition) es deducible (vraie) o no en esta teoría” (1930, cap. 2, 
2.1; EL, p. 64). Su estrategia para resolverlo consistió en tratar de reducir el 
caso general al caso especial de las matrices, ya resuelto. Para ello asocia 
una clase bien determinada de matrices a cada fórmula del cálculo. Explica- 
ré cómo construir tales matrices en el caso de una fórmula cualquiera q de 
nuestro CP1=. Divido la explicación en varios pasos, numerados para ma- 
yor claridad. 


dl “Se sobreentiende que la letra que designa una variable puede ser reemplazada sin incon- 


veniente por otra (y, en particular, se puede utilizar cualquier letra como variable liga- 
da), a condición eso sí de que dos variables [dentro de una misma fórmula] no pueden 
designarse con la misma letra más que en el caso en que ambas estén ligadas y que sus 
alcances [en nuestra jerga: el alcance de los cuantificadores que las ligan—R.T.] no 
tengan ningún signo en común” (Herbrand, EL, p. 62). A la luz de la equivalencia (7) 
del Apéndice XIII es claro que esta convención está semánticamente justificada en 
nuestro CP1=. Sin ella no es posible deducir la tautología (VxPx w —VxPx) en el sis- 
tema de Herbrand. En efecto, partiendo del axioma (Px v —Px) tenemos la deducción 
siguiente (donde simbolizo con => cada aplicación de una de las reglas de generaliza- 
ción o transición): (Px vw —Px) => 3Iy(Px v —Py) => (Px v HJy-Py) > (Px v —VyPy) 
> Vx(Px v VyPy) > (VxPx vw —VyPy). Conforme a la convención citada, la conclu- 
sión puede reescribirse (VxPx vw —VxPx). 
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(1) Como las variables ligadas son intercambiables en la forma arriba 
especificada, podemos, sin pérdida de generalidad, requerir que f cumpla las 
tres condiciones siguientes: ninguna variable libre en q ocupa en d posicio- 
nes donde está ligada; toda variable ligada en q figura en el alcance del cuanti- 
ficador que la liga; no hay en q dos cuantificadores que liguen la misma 
variable. En el Apéndice XIII llamamos regular a una fórmula que cumple 
estas condiciones. Supondremos, pues, que y es una fórmula regular. 

(2) Llamamos prenexa a una fórmula en la cual ningún cuantificador fi- 
gura dentro del alcance de un conectivo (Apéndice XIII). Llamaré antiprenexa 
a una fórmula en la cual ningún conectivo figura dentro del alcance de un 
cuantificador. Aplicando las reglas de transición en uno o el otro sentido, se 
deduce de q una fórmula prenexa (* y una fórmula antiprenexa q*. Como es 
obvio, $ puede deducirse a su vez de cualquiera de estas dos fórmulas. Diré, 
por ello, que cualquiera de estas tres fórmulas equivale deductivamente a las 
otras dos. Herbrand llama a q* la forma canónica de 4. 

(3) Asignamos a cada fórmula y una altura, determinada por los functores 
que contiene, de acuerdo con las reglas siguientes: (1) Si y no contiene 
functores su altura es 0; de otro modo, la altura de y es igual a la máxima 
altura que tenga un functor en y. (ii) La altura de un functor f en una deter- 
minada posición dentro de la fórmula y depende de su alcance en esa posi- 
ción: si éste no contiene functores, f tiene altura 1; pero si el alcance de f 
contiene un functor de altura k y no contiene ningún functor de altura mayor 
que k, la altura de f en la posición considerada es k+1. Sea, pues, h > 0 la 
altura de nuestra fórmula q. 

(4) Sea E una variable ligada en q por cierto cuantificador Q. Diremos 
con Herbrand que € es una variable general si Q es universal y está dentro 
del alcance de un número par de signos de negación o si Q es existencial y 
está dentro del alcance de un número impar de signos de negación, y que € 
una variable restringida si Q es existencial y está dentro del alcance de un 
número par de signos de negación o si Q es universal y está dentro del al- 
cance de un número impar de signos de negación. El lector podrá compro- 
bar que g£ es en q), respectivamente, una variable general o restringida, según 
que el cuantificador que liga a € en la fórmula prenexa (* sea universal o 
existencial. 

(5) Supongamos que £ y € son dos variables distintas ligadas respectivamen- 
te en q por los cuantificadores Q y Q”. Si el alcance de Q' está contenido en el 
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alcance de Q diremos que é supera a € en q. Si € supera a € en la fórmula 
antiprenexa q* (la forma canónica de q) diremos que € domina a € en q. 

(6) Sea € una variable general dominada en q por r variables restringidas 
E1 --- > E, (r > 0). Asociamos a £ de modo exclusivo un functor r-ario fo 
elegido entre los functores del CP1= que no figuran en q. La exclusividad 
requerida está garantizada si numeramos las variables ligadas de q según el 
orden en que aparecen —de izquierda a derecha— en esa fórmula y los 
functores r-arios que no figuran en q según el número de palotes que contie- 
nen, y asociamos el k-ésimo de estos functores r-arios a la k-ésima variable 
general dominada en q por r variables restringidas. Si la variable general € 
no está dominada por ninguna variable restringida le asociamos, también en 
forma exclusiva, una constante que no figure en q. 

(7) Ahora explicaré, siguiendo de cerca a Herbrand, cómo se construye, 
para cada entero positivo p, un conjunto finito de objetos A(b,p) dependiente 
de nuestra fórmula q. Los elementos de A(b,p) serán constantes del CP1= 
que figuran en q o han sido asociadas a una variable general de ( no domi- 
nada por variables restringidas, o provendrán de la secuencia $ =k;, K»,... 
de las constantes del CP1= (ordenadas por el número de palotes) que no 
están comprendidas entre las anteriores. Tendremos que referirnos a más de 
una secuencia formada eliminando de $ todas las constantes que pertenecen 
a algún conjunto C y renumerando las restantes en el orden en que figuran 
en $; llamaré FAC a la secuencia así definida. Primero construiremos una 
A 
C, es el conjunto de las constantes que figuran en q o han sido asociadas a 


de conjuntos de constantes que figuran en $*t, como sigue: 


una variable general de q. Si q no contiene constantes ni variables generales 
no dominadas por variables restringidas, estipulamos que C, = £x,).% Para 
construir C, procedemos así: Con los functores de altura 1 que figuran en q 
y los functores asociados a las variables generales de q formamos una lista 
de functores ¿y =f;,..., f, ordenada lexicográficamente por la r-aridad y el 
número de palotes de cada uno; si f, es m-ario (1 < 1 < s; m > 0), le asigna- 
mos, en forma exclusiva, una constante de la secuencia $ al par formado 
por f, y cada m-tuplo k e C,”. Concebimos esta constante como el “valor” 
de f, en dicho m-tuplo. Tales valores se eligen de modo que constituyan 


28 De hecho, en ese caso $ comprende todas las constantes del CP1=, a, Ay Ap... 5 así 


que la estipulación antedicha significa que C, = (a). 
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precisamente un segmento inicial k,,..., k, de la secuencia £XC,. Enton- 
ces, C, = ([Kj, .. . »K, y, a menos que k, e C;,, en cuyo caso C), = [K), ... ,K,). 
Supongamos ahora que se han construido las colecciones C,,..., C, (k < 


p). Sea U, = C¡U...U C, . Entonces C,,¡ estará formado por constantes 
de la secuencia $' elegidas entre las que no pertenecen a U, de tal modo que 
(i) si k € Cy, « es el valor de un determinado functor m-ario f, de la lista 
Y en un determinado m-tuplo A e U,”, tal que A £ U, ,”;” (ii) los elemen- 
tos de U,,, que no pertenecen a C, constituyen un segmento inicial de 4. 
Estipulamos que U, = C, U...U C, = A(b,p). Sea N la cardinalidad del 
conjunto A(b,p). Los elementos de A(d,p) forman una subsecuencia finita 
Qy, ++. , Ay, de la secuencia a, a, ay ..., de las constantes del CP1=. 

(8) Asociaré a q una matriz q% que llamo, con Herbrand, la reducida 
(réduite) de 4. La defino por inducción sobre las subfórmulas de q. Si y 
es una fórmula elemental, su reducida w* = y. Si y y x son fórmulas cua- 
lesquiera, yw = —(wB) y (y v 1É = (y v y). Si E es una variable ge- 
neral dominada en q por las variables restringidas €, ... , €, y la subfórmula 
y es el alcance del cuantificador QÉ que liga a € en q, (QEw)* es la fórmula 
que se obtiene reemplazando £ por el término Te6r . . . E, en todas las posi- 
ciones libres de € en y* (recuérdese que fe es el functor k-ario asociado a la 
variable general €; como las variables £;,.... , €, dominan a £, están libres 
en todas las posiciones que ocupan en Qgéwy). Si € es una variable restringida 
y y es el alcance del cuantificador que liga a € en q, designo con ywX(a/8) a 
la fórmula resultante de reemplazar la variable E por la constante a. en todas 
las posiciones de € en w* (en virtud de nuestras convenciones iniciales, to- 
das esas posiciones son libres). Como sabemos, el cuantificador que liga a € 
será existencial (si está en el alcance de un número par de negaciones) o 
universal (si está en el alcance de un número impar de negaciones). Según 
cual sea el caso, aplicamos una de las dos convenciones siguientes:*! 


za Esto quiere decir que si 2 = (A;,....A,), hay al menos un entero positivo j < m tal 


que 2, € C,. La estipulación sirve para asegurar que f, no tenga en C,,., nuevos valores 
correspondientes a m-tuplos formados con elementos de U,_,, a los que ya se asignó 
un valor de f, en U,. 


dad En la citada versión inglesa —Herbrand LW— réduite se traduce expansion. 


E En la segunda igualdad uso como Herbrand, en aras de la claridad, el conectivo 1; 


pero se sobreentiende que y A y no es más que una abreviatura de "(=y v 2). 
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GEw)* = yk(a/E) VWo.. Y y(ay/¿) 


(VEN? = ya /E) A... A yXaylE) 


(donde Lat¡,... Ay) = A(Q,p)). La construcción descrita determina la redu- 
cida $ de nuestra fórmula q si ésta no contiene variables libres. Si y con- 
tiene las variables libres 1n,,..., 1,, dk será, por definición, la reducida de 
su clausura universal: $ = (Vn, ...Vn,4)%, Recordando que la altura de q 
es h, vemos que la matriz Y% contiene functores de altura q < h. 

(9) Ahora asociaremos a (q una nueva matriz que no contenga functores. 
Observamos que el alcance de cada functor m-ario f que ocupa en Q% una 
posición de altura 1 consiste precisamente en un m-tuplo de constantes 
pertenecientes a A(),p) = U,; en virtud de la construcción del párrafo ante- 
rior, U,,, contiene una constante a. que es el valor de f en dicho m-tuplo. 
Reemplazamos por a el término que f encabeza en la posición considerada. 
Para reemplazar en forma análoga los functores de altura superior a 1, cons- 
truimos los conjuntos de constantes C,,,>, . . . , Cy, definidos como sigue: si 
f es un functor m-ario que tiene altura q en cierta posición que ocupa en q 
(1 <q < h), C, ,, contiene un valor para cada argumento admisible de q en 
(U,+,1)”, dicho valor pertenece a S$XU,,,_, y precede a todos los elementos 
de $ U,,+ + Los “argumentos admisibles” en cuestión son todos los m-tuplos 
(Ay ++ A) E CU), 1)” determinados así: si el ¡-Ésimo término en el alcan- 
ce de f en la posición considerada es una constante, ya es esa constante; si 
es una variable, A; puede ser cualquiera de las constantes de $ incluidas en 
U,, 5 si comienza con un functor de altura w < q, A, puede ser cualquiera de 
los valores asignados a ese functor en U,,,,. Los functores de altura mayor 
que 1 pueden ahora eliminarse en h — 1 etapas sucesivas. Al comienzo de la 
q-ésima etapa (1 < q < h), cada functor m-ario f que ocupa en Q% una posi- 
ción de altura q va seguido en esa posición por un m-tuplo de constantes 
pertenecientes a U,,,, ,; el término encabezado por f se reemplaza entonces 
por el valor de f en dicho m-tuplo, el cual es una constante perteneciente a 
O), El resultado final es una matriz sin functores que llamaré la matriz de 
orden p para controlar la deducibilidad de q, o, abreviadamente, la (d,p)- 
matriz de q. La designo I1,(4.p). 

(10) Herbrand enseña también a construir lo que llamaré la matriz de orden 
p para controlar la consistencia de q, o (c,p)-matriz de q. La designo I1.(0,p). 
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Los pasos (6)-(9) de la construcción de II (b.p) describen exactamente la 
construcción de I1.(),p) si intercambiamos los términos “variable general” y 
“variable restringida” (de tal modo que ahora se asocie un functor r-ario e a 
cada variable restringida dominada por r variables generales, etc.).2 La co- 
lección de constantes construida por esta vía en el paso (7) normalmente di- 
fiere de A(6b,p); si hay que referirse a ella podemos llamarla (0,p). 


Por fin estamos en condiciones de enunciar el Teorema de Herbrand: la 
fórmula q es deducible (vraie) si y sólo si hay un entero positivo p tal que 
TI(0,p) es una identidad de la primera especie con respecto a sus compo- 
nentes elementales. La demostración del Teorema enseña, de paso, a deducir 
de los axiomas, sin invocar la regla modus ponens, cualquier fórmula q tal 
que, para algún p > 0, IL(4,p) cumpla la condición antedicha.%* El Teorema 
se puede enunciar también, como es obvio, haciendo referencia a las matri- 
ces para controlar la consistencia: la fórmula q es consistente (con los axio- 
mas del sistema) si y sólo si para cada entero positivo p hay una valuación 


Esta correspondencia en apariencia mágica entre los procedimientos para construir 
TT,(0,p) y !C0,p) tiene una explicación muy sencilla. y es consistente con los axiomas 
del sistema si y sólo si su negación —q no se deduce de ellos. Así, la matriz para con- 
trolar la deducibilidad de —q servirá también para controlar la consistencia de d: 
Top) = —M.(6,p). Ahora bien, la forma antiprenexa (4)? = —(4*), de suerte que 
las relaciones de dominio entre variables son las mismas en Qf y —(; pero la forma 
prenexa (=4)* difiere —((*) precisamente en cuanto las variables ligadas en —(4*) por 
un cuantificador universal están ligadas en (—4)* por un cuantificador existencial y 
viceversa (cf. Apéndice XIII, (4) y (5)), de suerte que las variables generales y restrin- 


gidas de q son, respectivamente, las variables restringidas y generales de —04. 


33 Por lo tanto, el famoso Teorema del Corte de Gentzen (1936), que enseña a deducir 


cualquier fórmula prenexa sin aducir el equivalente gentzeniano de modus ponens, es 
un caso especial del Teorema de Herbrand. La expresión “(IL((b,p)” es mía; Herbrand 
enuncia su teorema en términos de “la propiedad B de orden p” definida así: La fór- 
mula q tiene la propiedad B de orden p si (lo que yo he llamado) la (d,p)-matriz de q 
es una identidad de la primera especie con respecto a sus componentes elementales. El 
Teorema dice entonces que “la condición necesaria y suficiente para que una proposi- 
ción sea deducible (vraie) es que tenga la propiedad B [de orden p, para algún entero 
positivo p]” (Herbrand, EL, p. 139; el texto entre corchetes no corresponde a nada que 
figure en el original francés, pero es indispensable; la versión inglesa contiene una 
inserción equivalente). La elección de la letra B para nombrar la propiedad en cuestión 
se justifica porque en la demostración del Teorema Herbrand apela a otras dos propie- 
dades de fórmulas, definidas por él, que llama A y C. 
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de la matriz 1.(4,p) tal que el valor lógico de ésta es V.** 

El siguiente ejemplo ilustra la fuerza del Teorema. Sea q una fórmula que 
no contiene functores y equivale deductivamente a una fórmula prenexa en 
la que ningún cuantificador existencial precede a un cuantificador universal. 
Entonces hay un algoritmo para determinar si y es o no deducible. En efec- 
to, en tal caso las variables generales de q no están dominadas por ninguna 
variable restringida, de modo que, para todo entero positivo p, C,,, = Y y 
A(b,p) = A(6,1) = C,. Por lo tanto, p es deducible si y sólo si I[,(b,1) es una 
identidad de la primera especie con respecto a sus componentes elementales. 
Basta, pues, aplicar a 11,(4,1) el algoritmo que determina si esta matriz es o 
no una tautología, para decidir si f es o no deducible. El Entscheidungs- 
problem para esta clase de fórmulas había sido resuelto por Bernays y 
Schónfinkel (1928), pero la solución basada en el Teorema de Herbrand es 
enormemente más simple. Por otra parte, el argumento que acabo de dar 
sugiere que el Entscheidungsproblem bien podría ser insoluble en el caso 
general. En efecto, si f es una fórmula cualquiera podría ocurrir que —en 
contraste con la clase de fórmulas recién considerada— A(Q,p+1) contenga 
más elementos que A(Q,p), para cada p > O. Entonces, aunque se determine 
mediante un algoritmo que II (b,p) no es una tautología para cierto p, no 
cabe excluir que II,(b,q) lo sea para algún q > p y el procedimiento de de- 
cisión puede prolongarse indefinidamente. 

Herbrand no se hace cargo expresamente de esta última posibilidad, pero 
usa una terminología que inescapablemente —me parece— lleva a pensar en 
ella. Dice, en efecto, que una fórmula $ es “verdadera en un campo infinito 
(champ infini)” si cada matriz de control de consistencia I1.(Q,p) admite una 
valuación que le asigna el valor lógico V, y que es “falsa en un campo infi- 
nito” si cada matriz de control de validez 11 ((b,p) admite una valuación que 
le asigna el valor lógico F (p > 0). Según esto, ( es verdadera en un campo 
infinito si y sólo si —4 es falsa en un campo infinito y q es falsa en un 


Ja Como recordé en la nota 32, la fórmula q es consistente si y sólo si 4 no es deduci- 


ble. Según el primer enunciado del Teorema, —q es deducible si y sólo si hay un p > 
0 tal que I1[/(—0,p) es una tautología. IL/(—0.p) = IL(0,p). Ahora bien, si no hay un 
p > 0 tal que —IL(d,p) sea una tautología, tenemos que, para cada p > O hay una 
valuación de —11.((,p) y 1L(Q,p) que asigna a —IL(b,p) el valor F y, por ende, el valor 
V a TL(Ó,p). 
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campo infinito si y sólo si 4 es verdadera en un campo infinito.*% Con este 
vocabulario, nuestro segundo enunciado del Teorema de Herbrand puede 
expresarse con gran concisión: q es consistente (con los axiomas del siste- 
ma) si y sólo si es verdadera en un campo infinito. Equivalentemente, ( es 
deducible si y sólo si no es falsa en un campo infinito. En palabras de 
Herbrand: 


TE0REMA 1. Si P es una identidad, —P no puede ser verdadera en un campo 
infinito. 
TEOREMA 2. Si P no es una identidad, se puede fabricar un campo infinito 
en el que —P es verdadera. 

(Herbrand, EL, p. 143) 


Herbrand observa que “Lówenheim (1915) ya enunció resultados análogos”, 
pero le hace dos reproches. En primer lugar, Lówenheim confiere a la no- 
ción de “verdad en un campo infinito” un significado “intuitivo”, por lo cual 
“su demostración del Teorema 2 no alcanza el rigor que nos parece desea- 
ble”. Pero además, “y éste es el reproche más grave, Lówenheim considera, 
al parecer, justamente a causa del sentido intuitivo que le da a dicha noción, 
que el Teorema 1 es evidente”. Según Herbrand, ello es “completamente 
inadmisible” y llevaría, por ejemplo, “a considerar evidente la no-contradic- 
ción de la aritmética” (EL, p. 143). Este reproche nace de un malentendido: 
Lówenheim usa la palabra “identidad”, como es habitual en matemáticas, para 
referirse a una ecuación que está satisfecha como quiera que se le asignen 
valores a sus variables. Las identidades de primer orden de su cálculo de 
relativos, traducidas a nuestro CP1=, son precisamente las fórmulas váli- 
das, es decir, verdaderas en cualquier interpretación. Si “identidad” se en- 
tiende de este modo, el citado Teorema 1 es trivial. Pero lo que Herbrand 
llama “identidad” es una fórmula deducible en su cálculo; se trata, pues, de 
un término de significado puramente sintáctico, no semántico como el de 
Lówenheim. El equívoco oculta una relación importante; tomados simultá- 
neamente en su doble acepción, sintáctica y semántica, los Teoremas 1 y 2 
caracterizan a la vez las fórmulas deducibles y las fórmulas válidas: q es 


33 Puesto que TI.(p,p) = IL (—0,p) y M.Ebp) = H¿E0,p), y, como es obvio, 


TL¡(+-0.p) equivale —semántica y deductivamente— a IL(0,p). 
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deducible en el sistema de Herbrand si y sólo si hay un entero p > 0 tal que 
TL(+0,p) tenga el valor F en cada valuación, y esto ocurre si y sólo si q es 
válida. Por lo tanto, si, desestimando los reproches de Herbrand, considerá- 
semos que en su versión semántica el "Teorema 1 es obvio y el Teorema 2 
fue demostrado por Lówenheim,** concluiríamos que al establecerlos en su 
versión sintáctica Herbrand ha probado que su sistema deductivo para el 
cálculo predicativo de primer orden es correcto y completo (Apéndice IX.F). 
Como veremos enseguida (en el Capítulo 2.8), Kurt Gódel se doctoró en 
matemáticas casi al mismo tiempo que Herbrand, con una tesis en la que 
demuestra —sin equívocos— que dicho sistema es completo, esto es, sufi- 
ciente para deducir todas las fórmulas válidas de primer orden. Pero Gúdel 
adopta de entrada el punto de vista semántico —con lucidez sin paralelo hasta 
entonces— y en el punto decisivo de la prueba avanza al infinito sin miedo, 
“con arreglo a formas de inferencia conocidas” (nach bekannten Schluf- 
weisen—Gúdel, CW, I, 116), propias de la matemática clásica. Gracias a ello, 
produce un escrito de gran claridad y limpieza, digno antecesor de la obra 
revolucionaria (Gódel 1931) que estudiaremos en el Capítulo 2.10. 


dd Para que el Teorema 2 arriba enunciado sea un corolario del Teorema 2 de Lówenheim 


1915 no sólo hay que entender “identidad” en su acepción semántica, sino además “campo 
infinito” en su sentido literal y no, como Herbrand, sólo como una facon de parler. 
Como se vio en la p. 252, el Teorema 2 de Lówenheim 1915 dice que toda ecuación 
huidiza de primer orden falla para alguna asignación de valores a sus variables en un 
dominio enumerable. Una ecuación huidiza en el sentido de Lówenheim corresponde 
en nuestro CP1= a una fórmula q tal que (1) y no es válida, pero (ii) —4 es falsa en 
cualquier interpretación (Dor y) tal que 19, es un entero positivo p. El Teorema 2 de 
Lówenheim 1915 implica que hay una interpretación (9,,.f,,) tal que IM, = 0 y £.,(0) 
= 1, de modo que q es falsa y, por ende, —q es verdadera en dicha interpretación. (Si 
Q no es válida pero corresponde a una ecuación huidiza, —q no satisface la condición 
(11) y por lo tanto es realizable en un dominio finito y, a fortiori, en cualquier dominio 
infinito que lo contenga). En su luminosa introducción a la traducción inglesa de las 
obras de Herbrand, Goldfarb explica cómo la construcción de lo que llamé matrices de 
control viene a ser “un sustituto finitista (a finitistic surrogate)” de la noción semánti- 
ca de realizabilidad en un dominio enumerable (Herbrand, LW, p. 11; cf. pp. 11-14). 


37 No debo cerrar este capítulo sin mencionar otro giro adoptado por Herbrand para co- 


municar su hallazgo: el Entscheidungsproblem se reduce en cada caso “a un problema 
que es una generalización simple del problema de la resolución efectiva de un sistema 
de ecuaciones diofánticas” (EL, p. 199; cf. pp. 31s., 193ss.) Una ecuación diofántica 
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es una ecuación algebraica cuyos coeficientes son números enteros y cuyas soluciones 
se buscan entre los enteros. La observación de Herbrand implica que una solución del 
Entscheidungsproblem resolvería de paso el 10% problema de Hilbert: Dada una ecua- 
ción con cualesquiera incógnitas y coeficientes enteros, indicar un procedimiento que 
permita decidir mediante un número finito de operaciones si esa ecuación admite nú- 
meros enteros como soluciones (Hilbert 1900a en GA, III, p. 310). Matijasevic (1970) 
se apoyará en la solución negativa del Entscheidungsproblem por Church y Turing (vide 
infra, Capítulo 2.11) para demostrar que el 10” problema de Hilbert es asimismo inso- 
luble. Y. I. Manin, en su Curso de lógica matemática (1977), ofrece una excelente ex- 
plicación del descubrimiento de Matijasevic (cap. VI), que precede a su exposición de 
los teoremas de incompletud de Gódel (cap. VID) y de la solución negativa del Ent- 
scheidungsproblem (cap. VID. 


2.8 EL CÁLCULO PREDICATIVO 
DE PRIMER ORDEN ES COMPLETO 


En este capítulo estudiaremos el primero de los grandes descubrimientos de 
Gódel: el cálculo predicativo de primer orden, organizado como sistema 
deductivo a la manera de Frege, o de Whitehead y Russell, es un cálculo 
completo, en el sentido preciso que explicaré enseguida y que, siguiendo justa- 
mente a Góúdel, le damos comúnmente a esta expresión (v. Apéndice IX.F). 
Gódel enuncia y demuestra este resultado en su tesis doctoral (1929) y tam- 
bién en un artículo publicado en la revista de Hilbert, Mathematische Annalen 
(1930). Casi más importante que la demostración —que ha sido reemplaza- 
da generalmente en la literatura didáctica por otra más versátil y expedita 
debida a Henkin (1949)— es la clara concepción de las ideas envueltas, 
especialmente el distingo entre validez (o verdad lógica) y deducibilidad. Con 
ello se consolida el enfoque semántico que estaba implícito ya en la obra de 
Lówenheim (1915), pero que la escuela de Hilbert tendía a desvirtuar.! El 
artículo es más conciso y elegante que la tesis y contiene un importante teo- 
rema que falta en ésta, pero omite casi todas las consideraciones metodo- 
lógicas, no sé si en aras de la brevedad o para evitar polémicas. En la si- 
guiente presentación utilizo ambas fuentes.? 

El párrafo inicial del artículo plantea el problema con insuperable luci- 
dez: En Principia Mathematica, Whitehead y Russell adoptan como axio- 
mas ciertas proposiciones evidentes y proceden a deducir de ellas —confor- 
me a ciertas reglas de inferencia precisas y sin prestar atención al significa- 
do de los símbolos— los teoremas de la lógica y las matemáticas. Ante este 
procedimiento, cabe preguntarse si el sistema de axiomas y reglas de infe- 
rencia propuesto es completo (vollstándig), esto es, “si efectivamente basta 


Piénsese que Herbrand llama propositions vraies justamente a las fórmulas deducibles. 


La excelente versión castellana de las Obras completas de Gódel, editada por Jesús 
Mosterín, contiene el artículo (pp. 23-37), mas no la tesis. Ésta aparece, acompañada 
de traducción inglesa, en Gódel CW, vol. L pp. 60-101. 
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para deducir cada teorema lógico-matemático, o si cabe tal vez concebir 
proposiciones verdaderas (y eventualmente también demostrables conforme 
a otros principios) que no se pueden derivar en el sistema en cuestión” (1930, 
p. 349). Gódel recuerda que en el caso de las fórmulas verifuncionales esta 
cuestión había sido contestada afirmativamente por Bernays (1926) y anun- 
cia que la resolverá, también afirmativamente, para una clase más amplia de 
fórmulas, a saber, las del cálculo predicativo de primer orden.* 

La cuestión planteada supone que en el estudio de un cálculo lógico distin- 
gamos dos tipos de conceptos: (1) aquellos que “conciernen únicamente a 
los signos considerados como figuras espaciales” y (11) aquellos cuya defini- 
ción “tiene en cuenta el significado de las fórmulas” (Gódel 1929, $ 2, en 


Gódel 1929 declara, de entrada, que su propósito es probar que el “sistema axiomático 
del llamado cálculo funcional restringido” es completo, y explica que esta propiedad 
significa “que cada fórmula válida (allgemein giltige) expresable en [este cálculo] se 
puede deducir de los axiomas mediante una serie finita de inferencias formales” (CW, 
I, 60). En suma, un cálculo lógico premunido de axiomas y reglas de inferencia es 
completo en el sentido de Gúdel 1929, 1930, si es suficiente para deducir todas las 
verdades en su campo de aplicación. Post 1921 estableció que el sistema deductivo del 
cálculo proposicional es suficiente o completo en un sentido puramente sintáctico: si q 
es una fórmula del cálculo que no se puede deducir de los axiomas, entonces puede 
deducirse de ellos su negación —4. Tras observar que un sistema deductivo consistente 
para el cálculo predicativo de primer orden no podría ser completo en el sentido 
sintáctico, Hilbert y Ackermann (1928, p. 68) plantearon —quizás por vez primera— 
la cuestión de suficiencia abordada por Gódel. Dicen allí que “aún no se ha resuelto la 
cuestión de si el sistema axiomático [propuesto por ellos para ese cálculo] es completo 
en el sentido de que realmente se puedan derivar de él todas las fórmulas lógicas que 
son correctas (richtig) para todo dominio de individuos”. Pero la expresión “fórmulas 
lógicas” se introduce en ese libro de una manera que hace completamente incompren- 
sible el planteamiento citado. Cito: “Entre las fórmulas que pueden demostrarse me- 
diante el cálculo predicativo se destacan aquellas que no contienen constantes indivi- 
duales y cuya derivación no presupone otras fórmulas que las fórmulas lógicas básicas 
[los axiomas]. Llamaremos a estas fórmulas fórmulas lógicas” (Hilbert y Ackermann 
1928, p. 54). Según esta estipulación, pues, una fórmula lógica es siempre derivable y 
el cálculo es completo por definición. 

Siguiendo a Hilbert y Ackermanmn (1928), Gódel lo llama engeres Funktionenkalkiil (li- 
teralmente: “más estrecho cálculo de funciones”). En una nota explica que pertenecen a 
él todas las “expresiones lógicas” formadas con variables proposicionales y funciona- 
les —o sea, en nuestra jerga, con predicados n-ádicos, para cualquier n > 0— mediante 
las “operaciones” de disyunción, negación, cuantificación universal y cuantificación 
existencial, “en las cuales los prefijos Vx y 3x se refieren sólo a individuos, no a pre- 
dicados (Funktionen)” (Gódel 1930, p. 349, n. 3). 
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CW, LI 66). Hoy los llamamos conceptos sintácticos y semánticos, respecti- 
vamente. Gódel va a probar que, en el cálculo predicativo de primer orden 
de Principia Mathematica, la clase de las fórmulas deducibles (propiedad 
sintáctica) coincide con la clase de las fórmulas que expresan verdades lógi- 
cas (propiedad semántica). Para ello, caracteriza primero el cálculo que va a 
considerar y da una definición de estos dos conceptos, aplicable a las fór- 
mulas de ese cálculo. 

El cálculo considerado por Gúdel casi no se distingue del CP1=. Usaré, 
pues, nuestro simbolismo en lugar del suyo.? Con todo, seguiré su sintaxis 
en un respecto que no tiene su contraparte en la nuestra: Una letra mayúscu- 
la seguida de variables individuales entre paréntesis y separadas por comas 
representa una fórmula —normalmente, sin cuantificadores— en que las 
variables en cuestión ocupan posiciones libres. Según esto, la fórmula F(x,y) 
puede corresponder a nuestra fórmula elemental P?xy, pero también a una 
matriz compuesta como (P2xy > (P! y v P!,x)).* Al igual que Gódel, uso 
cualquier letra minúscula como variable individual y cualquier mayúscula 
como variable proposicional o en la función recién descrita. Góúdel elige como 
axiomas lógicos las ocho fórmulas siguientes: 


1 XvX>X 2 X>XvY 

3 XvY>YvX 4 (X>YVD)o(ZvXx>ZvY) 
5 VxF() > FO) 6 VxX v F()) >X v VxF(x) 
7 x=xX $ x=y>(F00)>F0) 


Las reglas de inferencia son: (1) Modus ponens. (II) “La regla de sustitución 


Gódel escribe 8 en vez de », (x) en vez de Vx y (Ex) en vez de Jx. Para facilitar la 
lectura, utiliza paréntesis de diversas formas. Simboliza la negación, a la manera de 
Hilbert y Ackermann, mediante una línea recta trazada encima de todo su alcance. Así, 


por ejemplo, su fórmula (xXEy)P(x,y) corresponde a nuestra —Vx3yPxy. 
Este simbolismo puede también interpretarse como una expresión del hecho siguiente: 
dada una formula con n variables libres, cabe siempre introducir un predicado n-ario 


que la represente. Así, en el caso del ejemplo, se puede introducir un predicado binario 
F definido por la equivalencia: Fxy + —(P?xy > (P! y v Plix). 
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para variables proposicionales y funcionales”.” (III) De A(x) se puede inferir 
VxA(x) (generalización universal). (IV) Todas las variables —libres y liga- 
das— de una fórmula se pueden reemplazar por otras, siempre que se obser- 
ven ciertas cautelas (dirigidas a impedir que la reemplazante de una variable 
libre sea “cazada” indebidamente por un cuantificador).? Hay que entender 
que (X > Y)” abrevia a (AX v Y)” y que el cuantificador existencial y los 
conectivos A y <> se definen en la forma habitual (Apéndice IX.D). Una 
fórmula q es deducible (abreviado HQ) si hay una prueba de q), refutable si 
hay una prueba de —4. Gódel no explica el término “prueba”, pero eviden- 
temente podemos adoptar una definición por el estilo de la que presenté en 
la p. 247: una lista de fórmulas (A, ... ,QL, ) es una prueba de oz, si y sólo si 
cada fórmula 01, es idéntica a uno de los ocho axiomas o se infiere de una 
fórmula a, por las reglas II-IV, o de un par de fórmulas a, y a, por la regla 
Td <k<n j¡j<h<k). 

Gódel explica así los conceptos semánticos esenciales de validez y 
realizabilidad (en la tesis; la explicación falta en el artículo). Sea a. una fór- 
mula que contiene las variables proposicionales X,,..., X,,, los predicados 
monádicos o poliádicos F,,... , F,, las variables individuales libres x,,...., 
Xp y fuera de eso sólo variables ligadas” (CW, L 66). Consideremos ahora 
ciertos “individuos” a;,..., a, pertenecientes a un cierto dominio (Denk- 
bereich) no vacío Y, ciertas “funciones (definidas en el mismo dominio)” 
fi... f, y aseveraciones (Aussagen) A;,..., A, “Diremos que este siste- 
ma S = (fi...) fy 4 --- >, Ap Aj, ..., Aj) realiza (erfúlle) la fórmula si, 
insertado (eingesetzt) en ella, genera una oración verdadera (en el dominio 
en cuestión).” Mediante esta definición, Gódel define los términos realizable 
(erfiúillbar) en un dominio determinado, realizable absolutamente (“hay un 
dominio en el que la fórmula es realizable”), válido (allgemein giltig) en un 
dominio determinado (“su negación no es realizable”) y válido absolutamente. 


Gódel no explica esta regla, pero entiendo que ella autoriza a reemplazar uniforme- 
mente (1) una variable proposicional por una fórmula cualquiera (siempre que ésta no 
contenga en posiciones libres una variable ligada por un cuantificador en cuyo alcance 
se hallaba alguna de las posiciones de la variable proposicional reemplazada) y (ii) 
cualquier subfórmula formada por un predicado n-ádico seguido de n variables libres 
por una fórmula cualquiera cuyas variables libres sean precisamente las mismas. 


Gódel no detalla estas cautelas, sino que remite a Hilbert y Ackermann 1928, III, $ 5. 


2.8 El cálculo predicativo de primer orden es completo 277 


Las fórmulas absolutamente válidas son las verdades lógicas. Las definicio- 
nes semánticas de Gódel no son impecables, pero apuntan sin duda a las 
que, siguiendo a Tarski, doy en el Apéndice IX.? 

Es fácil comprobar que los axiomas 1-8 son válidos en el sentido indicado 
y que las reglas de inferencia IV preservan la validez. Gódel lo acepta sin 
discusión. Por lo tanto, toda fórmula deducible es válida. Lo que va a pro- 
bar es la proposición recíproca: Toda fórmula válida del CP1= es deducible 
en el sistema deductivo descrito (Teorema I del artículo). Ella equivale a esta 
otra: Toda fórmula del CP1= es realizable o refutable (Teorema II). En efec- 
to, si vale el Teorema 1 y la fórmula q no es realizable, su negación —4 es 
válida y por ende deducible, de suerte que q es refutable, como dice el Teo- 
rema Il; mientras que si vale el Teorema Il y q es válida, —q no es rea- 
lizable y por ende es refutable, de suerte que ——04 es deducible y, con ella, 
también q, como dice el Teorema I. En vista de ello, Gódel acomete 
directamente la prueba del Teorema I1.' Lo prueba primero para las fórmu- 


Traduje lo más literalmente que pude el pasaje clave para criticar aquí sus defectos. 
Ante todo, ¿en qué consiste la operación de insertar (einsetzen) el sistema S en la fór- 
mula A? S consta de elementos lingiiísticos —las aseveraciones Aj,..., A, — que 
podrían, tal vez, insertarse literalmente en A, pero también incluye elementos no 
lingúísticos, que no sería posible acomodar dentro de una fórmula. Es razonable supo- 
ner que cuando habla de “insertar” ciertos individuos en la fórmula Gódel quiere refe- 
rirse al reemplazo uniforme de cada variable individual por una expresión que designe 
exclusivamente a uno de esos individuos. Otro tanto habría que decir de la inserción 
de las funciones f;,..., f;. Hay que advertir, además, que cada una de éstas tendrá 
que ser lo que solía llamarse una “función proposicional”, esto es, un aplicación de Y” 
en (0,1) o en (“lo verdadero”, “lo falso”), con n igual a la n-adicidad del predicado 
de la lista (F,,..., F,) en cuyo lugar la función se “inserta”. En Gúdel 1929 y 1930 
falta toda indicación sobre el empleo de functores (signos que se combinan con térmi- 
nos para formar nuevos términos; vide Apéndice IX.E). Por otra parte, en vista del papel 
que desempeñan las variables proposicionales en el cálculo lógico, no hace falta, para 
juzgar la realizabilidad de una fórmula que contenga tales variables, que éstas se sus- 
tituyan con aseveraciones bien determinadas, como propone Gódel; basta asignarle a 
cada variable proposicional un valor veritativo fijo cualquiera. Finalmente, Gódel nos 
deja en la total oscuridad en lo que respecta a verdad o falsedad de la oración obtenida 
“insertando” el sistema S en la fórmula A cuando ésta contiene cuantificadores. Será 
Tarski quien, junto con elucidar la “inserción” como interpretación, enuncie con preci- 
sión las condiciones en que una fórmula precedida por Y o 3 es o no verdadera en una 
interpretación dada (cf. las reglas [I,,] e [I5] en el Apéndice IX.D). 


El Teorema II de Gódel 1930 incluye también la siguiente cláusula: Si una fórmula no 
es refutable, es realizable en un dominio infinito enumerable. Con este agregado, el 
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las que no contienen el signo de identidad y cuya deducibilidad o refutabilidad 
depende sólo de los axiomas 1-6, es decir, para el cálculo correspondiente a 
nuestro CP1. Luego, mediante un argumento sencillo, extiende el resultado 
al CP1=. 

Sea Y la clase de las fórmulas del CP1, Y8 la subclase de las fórmulas 
refutables (mediante los axiomas 1-6 y las reglas I-IV) y K la subclase de 
las fórmulas realizables. Se trata de probar que Y = KR U %8. Para abreviar, 
llamaré T a la clase H U 28. En virtud del resultado de Bernays aludido 
arriba, es claro que toda fórmula verifuncional, esto es, toda fórmula que 
consta sólo de variables proposicionales, conectivos y paréntesis, pertenece 
a T. La discusión puede, entonces confinarse a las fórmulas del CP1 que 
contienen también otros signos. Sea pues q una fórmula cualquiera de este 
tipo. Gódel prueba primero que q e Z si y sólo cierta fórmula de una clase 
especial $ < ¿Y pertenece a Y. La etapa decisiva de la prueba consiste en- 
tonces en establecer que $t <= Y. La reducción del problema general a este 
otro más particular comprende varios pasos que describo enseguida (en las 
notas doy una idea de la argumentación). Digamos, como de costumbre, que 
una fórmula y equivale lógicamente a otra fórmula y si la fórmula (y > y) 
es válida. Diré, por otra parte, que y equivale deductivamente a y si la fór- 
mula (y £ y) es deducible. Sin duda, hay una fórmula prenexa q, que equi- 
vale lógica y deductivamente a nuestra formula q.!! Obviamente, y e T si y 
sólo si q, e Y. Gódel muestra sin dificultad que la fórmula prenexa q, e Y 


Teorema II es estrictamente más fuerte que el Teorema I y contiene (una forma de) el 
Teorema de Lówenheim-Skolem. La prueba gódeliana nos rinde pues este importante 
teorema como suplemento. (La cláusula mencionada se aplica a las fórmulas del CP1; 
como se verá en la nota 27, en el caso del CP1= vale la condición más débil: Si una 
fórmula no es refutable, es realizable en un dominio enumerable, que puede ser finito. 
Piénsese que la fórmula VxVy(x = y), aunque irrefutable en el sistema descrito, única- 
mente es realizable en dominios que contengan un solo objeto). 
En efecto, las fórmulas representadas por los esquemas (2)-(5) y (8)-(14) del Apéndi- 
ce XIII son todas válidas y se deducen de los axiomas, usando las definiciones de los 
símbolos lógicos. En particular, el esquema (2) es la definición del cuantificador 
existencial; (3) (5) se deducen fácilmente de (2). La demostración de los esquemas 
(8)-14) depende decisivamente del axioma 6. 
2 Recuérdese que llamamos cerrada a una fórmula que no contiene variables libres. Si 
la fórmula prenexa q, contiene las variables libres £¡, E7,..., €, es claro que d, es 
realizable si y sólo si es realizable q, = 38,3€, ... 3€y,. Tenemos además que, si —0 
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si y sólo si hay una fórmula prenexa cerrada q, e 7.!? Por otra parte, la 
fórmula prenexa cerrada bp, e Y si y sólo si hay una fórmula prenexa cerra- 
da (y, cuyo prefijo comienza con un cuantificador universal y termina con 


Y 


un cuantificador existencial, tal que (, e T.!* Las fórmulas prenexas cerra- 
das cuyo prefijo comienza con un cuantificador universal y termina con un 
cuantificador existencial constituyen la clase especial $. Llamémoslas $- 
fórmulas. El grado de una $S'-fórmula es el número de cuantificadores uni- 
versales en su prefijo cuyos respectivos sucesores inmediatos son cuantifica- 
dores existenciales. Sea St, la clase de las $'-fórmulas de grado n. Gódel 


es deducible, la regla III permite deducir WE¡WE),... VE;0, y, por consiguiente, 
361365... 36,01; y que, si 38/3€)... 364, es deducible, también es deducible 
VE¡WE),... VEr0,, de la cual se deduce —Q, por aplicaciones repetidas del axioma 5 
y modus ponens. Por lo tanto, q, es refutable si y sólo si lo es Q,. 


Sea q, la fórmula prenexa cerrada Q€vy, donde y es una matriz y el prefijo QéÉ es una 
fila formada por uno o más cuantificadores de cualquier clase. Considérese la fórmula 
3 = VEQé3N(y A (DÉ v —On)), donde Y es un predicado monádico y € y n son 
variables individuales que no figuran en y (como hemos visto en otras ocasiones, esta 
indicación puede precisarse apelando al orden lexicográfico de predicados y variables: 
úsense los primeros que no figuran en y). (3 es lógica y deductivamente equivalente a 
Qéy a VEM(DÉ v —Dn). Como VEM(DÉ v —Dn) es a la vez deducible y válida, q, 
es lógica y deductivamente equivalente a Qéy = 4», de modo que q, sólo será realiza- 
ble o refutable si py lo es. 

Sea y € $, Sin > 1, y tiene la forma VEJ7Vx3I9QvY, donde Y es una matriz, 
Qu es una fila de cuantificadores de cualquier clase que comienza con uno universal y 
termina con uno existencial, y VE, 32, Vx y Im son filas de cuantificadores de la 
clase indicada. Obviamente, VxInQuY e $, y QuY e $K,_¡. Sean $ y y las fórmulas 
definidas como sigue: 


p= WEEDS) a VEVECO(E,E) > VWx3nQuY) 
y = VEVEWEVXAC A NQUD(E E) » (DEL) > Y) 


No es difícil ver que FfB > y. Invocando dos veces el teorema B enunciado más ade- 
lante en el texto (en la forma más general explicada entre corchetes), combinado con 
el teorema C, el lector podrá establecer que FB + y. Ahora bien, y € S',, de modo 
que, por hipótesis y e T. Si y es realizable, 3 es realizable y por ende también lo es y. 
Si y es refutable, $ es refutable, de modo que F=f. Reemplazando en f, D por 
Vx3inQuY tenemos que 


E-(WE'3(WxI90vY » VWEVU(Vx3InQuY > Vx39QuY)) 


La subfórmula a la derecha del signo A es, por cierto, deducible. Por lo tanto, 
F-WE'31'Vx3In9QuvY. Mediante una sustitución juiciosa de variables ligadas en la fór- 
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prueba que si $t, < Y, entonces $,,,, < T.!* Por lo tanto, si podemos probar 
que $t, < T, concluiremos, por inducción sobre el grado de las $'-fórmulas, 
que $ c Y, y por ende —en virtud de los pasos anteriores— que Y = 7. 
Como la clase 7 reúne las fórmulas refutables y realizables, ella es un híbri- 
do sintáctico-semántico y la prueba de que $', está incluida en Y tiene que 
participar de ambos aspectos. En su aspecto sintáctico, es larga y tediosa, 
pero elemental; en su aspecto semántico, es breve y brillante, pero nada ele- 
mental. 

Consideramos una $'-fórmula cualquiera yw de grado 1 en la que figuran 
r variables ligadas por cuantificadores universales y s variables ligadas por 
cuantificadores existenciales. y tiene la forma WEJLO(E,,....E,.C¡,....E,), donde 
Vé y 311 son filas de cuantificadores de la clase indicada, que ligan las va- 
riables Ejsxis Es Y Epicoón Ej respectivamente, y DlEsicco cbq:6) 85 Una 
matriz en que figuran las variables listadas (y sólo ellas). Con una maniobra 
similar a la ejecutada contemporáneamente por Herbrand (Capítulo 2.6), Gódel 
asocia a la fórmula y e $t, una secuencia de matrices O,, O,,.... construi- 
das como ahora explicaré. Cada variable individual del cálculo consta de una 
letra x seguida de n palotes (n > 0). Forman, pues, un conjunto infinito nu- 
merable Y = (xp, x;, . . . ), ordenado por el número de palotes de cada varia- 
ble. Consideremos la familia de todos los r-tuplos que pueden formarse con 
elementos tomados de V. Esta familia se puede ordenar atendiendo al núme- 
ro total de palotes contenido en cada r-tuplo; si dos r-tuplos contienen el 
mismo número de palotes, los ordenamos en orden lexicográfico. Así se forma 
la secuencia de r-tuplos X, = (Xg»Xg»-*-+XgsXo), Xy = (XgsXg»++«Xg:X 1), Xg = 
(XgXgs:+-X Xp), - - - Las matrices O,, O,,... se forman sustituyendo unifor- 
me y ordenadamente en O(8;,....E,.C;»....C,) las variables listadas por diver- 
sos (r+s)-tuplos tomados de Y. En cada caso, sustituimos el r-tuplo (8,,....S,) 
por uno de los r-tuplos de nuestra secuencia X,, X,, . .. y el s-tuplo (8,,...,€,) 
por las primeras s variables de Y que no se hayan utilizado todavía como 
sustitutos. Específicamente, 


mula precedente, obtenemos F-WEH¿WxINQUY, o sea, Fw. Así pues, y es refuta- 
Y 


ble si y lo es. Por consiguiente, y e L. Para obtener la misma conclusión en el caso 
n = 1 basta eliminar del razonamiento anterior la expresión Qu” y su descripción. 
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O, = O(X,,X¡,%7,-..,X;) 
O, = O, A OA s4 19% 5429: + "> X25) 


Siguiendo a Gódel, voy a usar varias abreviaturas. Llamo (P,,) al prefijo 
Xy1X¡...1x,,. Recordando como está construida la secuencia X;, X,,..., 
vemos que el prefijo (P,,) inevitablemente incluirá todas las variables del r- 
tuplo x,,¡. Llamo (P,') al prefijo que se obtiene al eliminar de (P,) a todos 
los cuantificadores que ligan variables contenidas en x,,,¡. Por último, llamo 
ns), Que figuran en O, 
pero no en O,, ,. Conforme a esta convención escribimos, pues, 


y, al s-tuplo de variables nuevas (o 11541m-1)54290 + >X 


O, = O.1 A O(X Y y) (1) 


El aspecto sintáctico de la prueba consiste principalmente en establecer 
que, para cada entero positivo n, la fórmula (y > (P,)J0O,,) es deducible. Sea 
n = 1. Por simple sustitución de variables ligadas, probamos que 


PWEJLO(E,....E7E1»---5,) > Vx Ty /0(X1,y 1) (2) 


(donde Wx, y y, son filas de cuantificadores que ligan, respectivamente, a 
las variables de x, e y;).'? También se muestra fácilmente que 


FVx 3y,/0(x y) > 3x,Iy,0(X y) (3) 


Por la transitividad de la flecha, de (1) y (2) se infiere hy —> (P,)0,. La tesis 
general quedará establecida inductivamente si podemos mostrar que, para cada 
n21,Hy A (P,J0,, > (P,, 10, , ¡). Como en el caso de (1), es claro que 


Como los r elementos de x, son la misma variable xq, sólo el último cuantificador de 
la fila Vx, liga en efecto a esa variable en todas sus posiciones libres en la matriz 
O(X,X],X> ...,X,)3 los r—1 restantes podrían borrarse. Pero evidentemente es más cómo- 
do escribirlos (abreviadamente), lo que ciertamente está permitido por la sintaxis del 
CP1 (Apéndice IX.A). 
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FVEJLO(E,, de is Ss ¿Sel 7, MV Y 1 O + 19Y 041) (4) 


Permutando los cuantificadores existenciales que forman el prefijo (P,), 
obtenemos 


H((P,J0,, ES IP, JO) (5) 


Para completar la prueba, Gódel invoca tres teoremas familiares de la lógica 
de primer orden (el lector que no los conozca puede ejercitarse en probar al 
menos los dos primeros):'? 


A Si ¿ es un r-tuplo de variables y a(E) y P(é) son dos fórmulas en 
que esas variables ocupan todas las posiciones libres, entonces: 


EWéa(E) n 1EP(8) > 1E(B(É) » aL(E)). 


B Sea QÉ una fila homogénea de cuantificadores (todos existenciales 
o todos universales) y Q([ otra fila, homogénea también. Sea (II) el 
prefijo que resulta al combinar en cualquier orden los cuantificadores 
de ambas filas. Entonces, si a(8) y B(L) son dos fórmulas en que 
las variables listadas ocupan posiciones libres, 


FQéu(E) » QU) S (IDía(é) a BCO) 


[Si Qé, o Qí, o ambos, son filas de cuantificadores no homogé- 
neas, lo dicho vale siempre que los cuantificadores provenientes de 
cada prefijo conserven en (II) el mismo orden que tenían en el pre- 
fijo de origen.] 


C Si la fórmula a. figura una o más veces como subfórmula en la 


Los teoremas A, B y C corresponden, respectivamente, a los “teoremas auxiliares” 1b, 
4 y 6, enunciados al comienzo de Gódel 1930. El teorema auxiliar 4 expresa el caso 
general de B, que formulo entre corchetes al final,. He preferido destacar el caso espe- 
cial en que todos los cuantificadores son de la misma clase, porque ese es el que apli- 
caremos luego. El caso general se emplea en el argumento esbozado en la nota 14. 
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fórmula O(a) y 6(B) es la fórmula obtenida al reemplazar a. por la 
fórmula fP, deductivamente equivalente a a, en una o más de las 
posiciones de a en O(a), entonces O(a) y O(B) son deductivamente 
equivalentes. En otras palabras, Ha <> B) implica que FH(O(a) > 


0(B).'” 


En la fórmula destacada en el teorema A sustituimos la subfórmula a(€) por 
Tv 10 ,,1>Y 1,1) y la subfórmula B(8) por (P,J0,, (donde, como se hizo notar, 
las r variables contenidas en x,,,, ocupan posiciones libres); sustituimos, asimismo, 
en los prefijos WE y 18 el r-tuplo E por x,,,. Resulta, entonces, que 
PY Y 1 O 41 Y 741 A £,1(P,)0, 

SS AR ((PDO, A TY OY 1113) (6) 


Ahora bien, las apódosis de (4) y (5) —esto es, las subfórmulas que siguen 
a la flecha en dichas fórmulas — son los dos miembros de la conjunción que 
forma la prótasis —la subfórmula que precede a la flecha— en (6). Pode- 
mos, pues, reemplazar ésta por la conjunción de las prótasis de (4) y (5),!* 
para obtener: 


PY A (249, 2 O A ACI O) (7) 


En la fórmula destacada en el teorema B ponemos n = (n + l)s y m= (ns — 
r) y sustituimos QE'o(É”) por Ay, ¡O(%,:1:Y11) Y QUPE”) por (P,)0,, 
Como el prefijo (P,,,,') se obtiene uniendo y reordenando los cuantificadores 
—existenciales todos — en Jy,,,, y (P,/), podemos identificarlo con el prefi- 
jo (ID). Tenemos, entonces, que 


CP 10, A NOR O CON A OR Y n+1)) (8) 


Pero 0, A O(X 419 n+1) = O, 1- Por lo tanto, (8) y B juntos implican que 


El “metateorema” C refleja el carácter “extensional” propio del cálculo predicativo. 
Todo buen manual de lógica matemática lo demuestra para el sistema deductivo adop- 
tado en él. Gódel 1930, p. 351, remite a Hilbert y Ackermann 1928, III, $ 7. 


18 Puesto que HA > B]A(CC>D)>(BAD>F)>(AnAC> F)). 
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Fr, JO, A OA Y +1) O PadBs (9) 


El lado izquierdo de la equivalencia (9) es la apódosis de (7). Reemplazán- 
dolo por el lado derecho, obtenemos el resultado que buscábamos: 


Ey A (PO, > Pri (10) 


Habiendo establecido que Fy > (P,)0, y que, para cualquier n > 0, hy 
A (P,)JO,, > (P,.,1J0,,,¡, podemos concluir que Hy > (P,)O,, para cada n > 
0. Por contraposición, F—=(P,J0O,, —> —v. Por lo tanto, si (P,JO, es refutable 
en el caso de algún entero positivo n, nuestra fórmula y, sujeta a la sola 
condición de ser una $'-fórmula de grado 1, también es refutable. Ahora bien, 
(P, JO, es refutable si F=(P,J0,, o sea, si F=0, (en virtud de la regla Ill, 
puesto que (P,) es una fila de cuantificadores existenciales y FV¿=a OS 
—J£a). Como O, es una matriz, hay una fórmula verifuncional 9, que se 
forma reemplazando uniformemente cada subfórmula elemental de O,, (cada 
predicado n-ádico seguido de n términos) por una variable proposicional 


(predicado O-ádico) diferente. (Para mayor comodidad en la exposición, su- 
pongamos que cada variable proposicional de O,, es reemplazada en 9, por 
ella misma.) Aplicando juiciosamente la regla de sustitución II, cualquier 
prueba de —9, se transforma en una prueba de —0,,. Por lo tanto, (P,J0O,, es 
refutable si la fórmula verifuncional 9, es refutable. Ahora bien, como sabe- 
mos, si 9, no es refutable, 9, es realizable, es decir, hay una asignación de 
valores veritativos a las variables proposicionales que figuran en 9, que hace 
“verdadera” a 9,. En la decisiva fase semántica de la prueba, Gódel explota 
este hecho para establecer que y es realizable cuando no es refutable, esto 
es, que y e Y. 

Para ello, hay que atender a la estructura interna de y. Sabemos que con- 
tiene las variables E;,..., Ey, Ci»... , €, A la luz de lo que ahora veremos, 


En otras palabras, la prueba de Góúdel está confinada a lo que suele llamarse cálculo 
predicativo puro (sin constantes individuales). Pero el argumento sintáctico arriba de- 
sarrollado no supone esta restricción y el argumento semántico que ahora veremos puede 
adaptarse sin dificultad al caso en que la fórmula y bajo consideración contiene cons- 
tantes individuales (es cosa de darles también a éstas una interpretación numérica como 
la que se les da a las variables). 
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es claro que Gúdel da por descontado que no contiene otros términos.!” 
Supongamos que contiene las variables proposicionales X;,,..., X,, y los 
predicados v-ádicos F,,... , F, (para diversos valores de v > 0). Como es 
Obvio, X¡,..., X, y F;,... , F, también están contenidos en cada matriz O, 
y son todas las variables proposicionales y predicados v-ádicos que allí figu- 
ran. Gódel nos invita a considerar, para un dado n > 0, un conjunto de Qh 
valores veritativos w,,, . . . , W;, y K funciones proposicionales f,,,... , fin 
definidas en el conjunto de enteros Z, = (z:0 <z < ns) y elegidas de modo 
que f;, tenga precisamente la misma v-adicidad que F; (1 <¡< k).2 Dire- 
mos, con Gódel, que este conjunto es un “sistema de realización de nivel n- 
ésimo” (Erfillungssystem n-ter Stufe) de la fórmula y si es verdadera la 
aseveración que se obtiene a partir de la matriz O, al asignar el valor veritativo 
w;, a cada variable proposicional X, (1 < ¡ < h), interpretar cada predicado F' 
como representativo de la función proposicional f;, (1 < ¡ < k) y reemplazar 
cada una de las variables xy, ... , x, que figuran en O, por su respectivo índice 
numérico (contenido en Z,,). Si S,, y S, son dos sistemas de realización de y 
de nivel m-ésimo y n-ésimo, respectivamente (m < n), diremos que S,, inclu- 
ye a S,, (S,, <= S,) si cada función f,,, e S,, es la restricción a Z,, de la fun- 


m m 
ción f;, € S, y los valores veritativos Wim Y W;¡, SON, respectivamente, iguales 
para cada índice ¡(l <¡<k,1<i<h). 

Es claro que, si la fórmula verifuncional 9, asociada a la matriz O, es 
realizable, tiene que haber una interpretación del tipo descrito en que sea 


verdadera, esto es, un sistema de realización de y de nivel n-ésimo.?! Como 


m 


20 Siguiendo a Gúdel, digo simplemente que la función v-ádica f está definida en Z, si 


está definida en (Z,)”. 

El sencillo truco siguiente genera la interpretación deseada, como el lector podrá fácil- 
mente comprobar. Recordemos que 9, se forma reemplazando cada subfórmula ele- 
mental de O,, por una variable proposicional. Supongamos, para mayor comodidad, que 
cada variable proposicional X, está representada en 9, por ella misma. Las demás 
subfórmulas elementales de O, pueden numerarse en el orden en que aparecen por pri- 
mera vez. Sea Y, la variable proposicional que reemplaza a la q-ésima subfórmula. Si 
9, es realizable, hay una asignación V de valores veritativos a las X, y las Y, tal que 
V(8,,) = 0 (“lo verdadero”). Ponemos w;, = V(X;). Si F; es v-ádico, definimos la fun- 
ción proposicional f;,: (Z,)" —> (0,1) como sigue: si hay un entero q tal que la g- 
ésima subfórmula elemental de O,, está formada por el predicado F; seguido por v 
variables con los índices numéricos z,, . . . ,z, respectivamente, entonces f;,(Z¡, - -- ,Zy) 
= V(Y,); en cualquier otro caso f;(Z;,-.. ,2,) =0. 


21 
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hemos visto, si y no es refutable, 9, es realizable y hay un sistema de rea- 
lización de y de nivel n-ésimo para cada n > 0. Teniendo en cuenta que 
m1 = 0, AO ans O es claro que cualquier sistema de 
realización de y de nivel (n+1)-ésimo provee una realización de O, y por lo 


X 


tanto incluye un sistema de realización de y de nivel n-ésimo.? Según Gúdel, 
de esta sencilla observación “se sigue, con arreglo a formas de inferencia 
conocidas (nach bekannten Schlufiweisen), que en tal caso hay una secuen- 
cia de sistemas de realización S,, S»,..., Si... (con S, de nivel k-ésimo), 
en que cada uno de los que siguen al primero contiene al que le precede” 
(1930, p. 356). Este es el paso decisivo en el argumento semántico de Gódel, 
así que vale la pena que lo examinemos con atención. En la tesis, lo explica 
un poco más. Anota con razón que, para cada n > 0, el número de sistemas 
de realización de y de nivel n-ésimo tiene que ser finito (pues es finito el 
número total de (h+k)-tuplos diferentes formados por h valores veritativos y 
k funciones proposicionales definidas en Z,). “Por lo tanto, al menos uno de 
los sistemas de realización de primer nivel tiene que estar contenido en in- 
finitos otros de nivel superior. Hay, pues, un sistema de realización de se- 
gundo nivel en que ese sistema está contenido, el cual a su vez está conte- 
nido en infinitos otros de nivel superior. Continuando este razonamiento se 
muestra en forma conocida la existencia de una secuencia de sistemas de 
realización S,, S»,..., S;j ..., ad infinitum, donde $, € S;,, y S, es de nivel 
¡-ésimo” (CW, I, 86).2 

¿Cuál es esa forma conocida de razonar a que se refiere Gódel? Contra lo 
que el pasaje anterior parecería destinado a sugerir, no puede tratarse de la 
inducción matemática. Ésta supone que, dado un objeto caracterizable con 
un índice numérico n, sepamos construir o señalar un objeto análogo con el 
índice n + 1. Pero en la situación que confrontamos aquí las cosas se pre- 
sentan al revés: con cada sistema de realización de nivel n > 1 está dado 
otro de nivel n—1, contenido en el primero. Repitiendo el razonamiento, 
obtenemos una serie finita de sistemas de realización en forma de muñeca 


22 Específicamente, si (w),....W;»f¡»....f3 es un sistema de realización de y de nivel (n+1)- 


ésimo, y designamos con F; a la restricción de f; a Za DW]. Wi» f"1)....f',3 es un sis- 
tema de realización de y de nivel n-ésimo incluido en (Ww,....Wp»fi LH. 


Es En el original, la última oración dice así : “So weiter schlieRend zeigt man in bekannter 


Weise die Existenz einer Folge von Erfiillungssystemen S,, S,,...., Sj ...., ad infinitum, 
wobei $, < S;,, und S, von ¡-ter Stufe ist.” 


2.8 El cálculo predicativo de primer orden es completo 287 


rusa: S, > S 1 > Sp >-+.> 58, > S,; pero eso no prueba que dicha serie 
coincida con la parte final de la serie obtenida a partir de otro sistema S 


m> 


con m > n. Por hipótesis, tenemos una galería infinita de “muñecas rusas” 
como la descrita, una para cada entero positivo n, pero no cabe combinarlas, 
por inducción, en una sola supermuñeca infinita. Por otra parte, hay una pro- 
posición —que Dénes Kónig (1926) dedujo del Axioma de Selección, pero 
que es estrictamente más débil que éste— que viene como anillo al dedo a 
la situación descrita por Gódel. Dice así: 


K Si 2,, 2>,... es una secuencia de conjuntos finitos no vacíos y 
hay una relación binaria R tal que para cada a e 2,,,, hay un b e 
2, tal que bRa, entonces hay una secuencia a;, a), ... tal que, para 


24 
cada n > 0, a, € 2, y a,Ra,,;. 


Para aplicarla a nuestro caso, basta identificar cada 2, con el conjunto de 
todos los sistemas de realización de y de nivel n-ésimo y escribir € en vez 
de R. Como Gódel no menciona a Kónig, sus editores sugieren que el pasaje 
citado no alude a la misma proposición K, sino más bien a los argumentos 
—pertenecientes al “folklore” matemático— que movieron a Kónig a adop- 


dd La siguiente proposición, equivalente a K, se suele llamar Lema del Infinito de Kónig 


en la teoría de grafos: Si un grafo infinito G contiene subgrafos G,, G,, ....., tales que 
ninguno de ellos tiene un punto en común con otro, pero cada punto de G,,,, está unido 


a un punto de G,, entonces existe un camino infinito p;, p»,...., tal que p; e G,. 


25 También Hilbert y Bernays, cuando reformulan la prueba de Gódel en Grundlagen der 


Mathematik, se abstienen de aducir expresamente el Lema de Kónig u otra consecuen- 
cia del Axioma de Selección, y presentan el paso al infinito en el argumento semántico 
como un simple ejercicio del sano sentido común. Vale la pena ver cómo lo hacen. En 
vez de nuestros sistemas de realización de yw (que son conjuntos finitos de valores 
veritativos y funciones proposicionales), Hilbert y Bernays consideran los distintos 
modos como se pueden distribuir los valores veritativos (1 y 0) entre las diversas fór- 
mulas elementales que figuran en cada matriz O,,. Sea q, el número de fórmulas ele- 
mentales diferentes que figuran en O,. Entonces hay 2% distribuciones posibles de va- 
lores veritativos entre las mismas. Si tomamos dichas fórmulas elementales en el orden 
de sus primeras posiciones (de izquierda a derecha) en O,, cada distribución W, queda 
asociada inequívocamente a un numeral del sistema binario (el sistema de numeración 
con base 2), a saber, la fila de ceros y unos correspondientes a cada fórmula elemental, 
en el orden señalado. Llamaré FW, al número representado por ese numeral. Conside- 
remos ahora dos enteros positivos m y n, tales que m < n. El lector recordará que todas 
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tarla (Dreben y van Heijenoort, en Gódel, CW, LI, 53). En todo caso, Gódel 
nunca ha cuestionado el Axioma de Selección y en la introducción a la tesis 
previene expresamente que no se inhibirá de utilizar ningún medio matemá- 
tico de prueba, una advertencia que sólo resulta pertinente en el punto que 


26 


las fórmulas elementales de O,, aparecen en O, antes que todas las fórmulas elemen- 
tales que no figuran en O,,. Diremos que la distribución W, asociada a O,, contiene a 
la distribución W,, asociada a O,, (W', < W',) si las fórmulas elementales comunes a 
ambas matrices reciben, respectivamente, los mismos valores en W,, y W',. Nótese que 
si WI, HW" ,,, EW, y SW", son los números representativos de cuatro distribuciones 
asociadas a las matrices indicadas por los subíndices y W,, c W,, y W”,, cc W",, en- 
tonces HW,, <+FW",, implica que +W, < FW”. Diremos con Hilbert y Bernays que una 
distribución de valores veritativos entre las fórmulas elementales de una matriz es una 
distribución realizadora (erfiillende Verteilung) de la misma, si le confiere el valor 1 
(“lo verdadero”). Por hipótesis, hay por lo menos una distribución realizadora de O,, 
para cada n > 0. Sim < n, O, es una conjunción de O,, con otras fórmulas. Por lo 
tanto, cada distribución W, realizadora de O,,, contiene una distribución W,, realizado- 
ra de O,,. Diremos que %W,, es el m-componente de W,. Nótese que, sim<k<mn y W, 
es el k-componente de W,, entonces el m-componente de W, es también el m-compo- 
nente de W,. “Según esto, resulta (demnach ergibt sich) que entre las distribuciones 
realizadoras de O,, tiene que haber por lo menos una que, para todo n > m, sea el m- 
componente de una distribución realizadora de O,” (Hilbert y Bernays, GG, IL, 194; 
cursiva mía). Entre las distribuciones que tienen esta propiedad, para un dado m > 0, 
hay una cuyo número representativo es menor que el de las demás; llamémosla W*,,. 
Hilbert y Bernays prueban que, si m y n son dos enteros positivos cualesquiera tales 
que m < n, entonces W*,, es el m-componente de W*,. Para ello, aprovechan lindamente 
la representación numérica de las distribuciones: Sea W, el m-componente de W*,, y 
“w,, la distribución realizadora de O, tal que W'*,, es el m-componente de W,; enton- 
ces, por la misma definición de W*,, y W*, tenemos que HW*,, < HW,, y HW*, < 
HW; por otra parte, como hice notar arriba, la aseveración conjunta de las condiciones 
Me, EW, W, EW, y HW*,, < HW,, implica que 4W,, <+W*,, de modo que +4W, 
= HW*,; por lo tanto, W', = W*, y W*,, es el m-componente de W*,. Este resultado 
determina inequívocamente una secuencia W*, c W*, C..., que sirve de base a 
una realización de y. Pero su impecable demostración constructiva no puede disimular 
el carácter no constructivo del paso previo que cité en cursiva. 


n 


n 


“Por último, debe considerarse que el problema aquí tratado no ha surgido (como, di- 
gamos, el problema de la consistencia de las matemáticas) con la disputa sobre los 
fundamentos [entre brouwerianos y hilbertianos], sino que, aunque nunca se hubiera 
cuestionado la validez sustantiva de la matemática “ingenua” (die inhaltliche Geltung 
der “naiven” Mathematik), tendría sentido plantearlo dentro de ésta (en contraste, por 
ejemplo, con el problema de la consistencia). Por esto, una restricción de los medios 
de prueba no parece más urgente aquí que a propósito de cualquier otro problema 
matemático” (Gódel, CW, I, 64). 
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estamos considerando.? 

Con la secuencia infinita de sistemas de realización de todos los niveles, 
S¡<S,< ..., Gódel tiene lo que necesita para probar que y es realizable, 
si lo son todas las matrices O, y las respectivas fórmulas verifuncionales 9, 
Consideremos el conjunto S = [w,,... Wyfi¡,..., f,y, caracterizado como 
sigue: (1) cada w, es un valor veritativo y cada f;es una función proposicional 
definida en el conjunto N de todos los números naturales (1 <i<h;1<j 
< k); (11) w, = w,,, para algún m > 0 (y, por ende, para todos); (111) hay un m 
> 0 tal que la restricción de f; a Z,, es igual a f,,, (y, por lo tanto, la restric- 
ción de f,a Z, es igual a f;, para todo n > m). Bajo las condiciones prescri- 
tas, es claro que, si asignamos la lista de valores (w,,..., w,) a la lista 
(X¡ ... , X,) de la variables proposicionales de y y entendemos que la lista 
(F,,..., F,) de los predicados monádicos o poliádicos de y representa la 
lista de funciones (f;, ..., fy), la fórmula y expresa una aseveración verda- 
dera. El sistema S ofrece así una realización o —como también se dice— un 
modelo de y. Con esto hemos terminado de probar que cualquier $'-fórmula 
de grado 1 es refutable o realizable. Como se vio antes, esta conclusión 
implica que cualquier fórmula del CP1 tiene la misma propiedad. Por su 
misma naturaleza, la prueba ha establecido, de paso, que si una fórmula del 
CPl1 es realizable, tiene una realización en el dominio de los números natu- 
rales. Esto es una forma del Teorema de Lówenheim-Skolem (vide nota 10 
y Capítulo 3.2). 

No voy a explicar el razonamiento, relativamente fácil, mediante el cual 
Gódel extiende estos resultados al CP1=." En el artículo —mas no en la 
tesis— prueba además el siguiente teorema: 


e La argumentación es algo más ágil en el artículo que en la tesis, pero la idea central es 


en ambos textos la misma: tratar el signo = como un predicado diádico que cumple las 
condiciones estipuladas en los axiomas 7 y 8 e invocar la suficiencia del CP1. Esbozo 
a continuación el razonamiento del artículo. Sea q una fórmula del CP1= que conten- 
ga precisamente las variables individuales E, ...., €, y los predicados IT,,..., TT,. Cons- 
truimos la fórmula Q' = y a Vx(x =x) a y, donde y es una conjunción formada como 
sigue: si Il es un predicado n-ádico (n > 1) contenido en la lista (IT,,.... IL) y 
(Er - + - E) es cualquier n-tuplo formado con variables de la lista (8,,... ,Ej), la fór- 
mula VE,VE¡...VE,...VE/(E, = E, > (M£;...€,...En —> HC¡...E,...€,)) es una de las 
subfórmulas unidas en y por el signo A (1 <r < h; 1 < s < n). Si tratamos el signo = 
como un predicado binario cualquiera, q” es una fórmula del CP1 y, por lo tanto, es 
realizable o refutable. Supongamos que d” es refutable, o sea, que —q* es deducible de 
los axiomas 1-6. Entonces, como Vx(x =x) A y es obviamente deducible de los axio- 
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TEorEMA X. Para que un conjunto infinito numerable de fórmulas del CP1= 
sea realizable, es necesario y suficiente que cada subconjunto 
finito del mismo sea realizable. 


En otras palabras, como se dice hoy, el CP1= es compacto. Los argumentos 
utilizados en los primeros pasos de la prueba del Teorema II sirven para 
mostrar que el Teorema X vale en general, si vale para cualquier conjunto 
numerable de $t-fórmulas de grado 1. Sea, pues, 


2= (WE¡35,0/(8,:€,),W8,1008,0,), Nós VE ICO bn: A , 


un conjunto numerable de $'-fórmulas de grado 1, con E, un r,-tuplo y £, un 
s,-tuplo de variables individuales (k, h > 0). Consideremos ahora, para cada 
k > 0, los r,-tuplos que pueden formarse con las variables individuales xp, 
X¡,--. Ordenados por la suma de sus índices, tales r,-tuplos forman una 
secuencia Xp, Xy2, - - - Designaremos con y, el s,-tuplo de variables indivi- 
duales caracterizado por la condición siguiente: al ordenar los y, en orden 
creciente de las sumas h+j (y lexicográficamente, para sumas iguales), la 


secuencia infinita resultante, Y ¡1 Y¡12, Y21> Y 13» Y20 Y31> Y ¡4 - - - coincide con 
la secuencia xy, X;, ... Como se hizo arriba con las matrices O,, definimos 
una secuencia de matrices =,, Z,,... , mediante las dos estipulaciones si- 
guientes: 


= D/(X115y11) 
n Al A EX 115Y 11) A 15 2(0-1)) AL. A AY 1) 


lg E 


mas 7 y 8, 4 es deducible de 1-8. Por otra parte, si q” no es refutable, tiene una 
realización 4 en N. La relación aritmética diádica que modela al predicado = en JM 
tiene que ser reflexiva, simétrica y transitiva (para que satisfaga a Vx(x =x) A y); por 
lo tanto, determina una partición de N en clases de equivalencia. El conjunto, posible- 
mente finito, de esas clases de equivalencia provee una realización /(M* de q” en la cual 
cada predicado II; (1 < ¡ < k) es modelado por la relación que subsiste entre las clases 
de equivalencia cuyos miembros satisfacen la relación que modela a Il; en Ml, y el 
predicado = es modelado por la genuina identidad. Obviamente, la fórmula q tiene que 
estar realizada en toda realización de Q'. En particular, J/4* constituye una realización 
de (y entendida como fórmula del CP1=. 
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Sea (P,,) una fila de cuantificadores existenciales que ligan a todas las varia- 
bles libres en Z,. Es claro que (P,)Z, se deduce del conjunto finito de 
premisas E, = (VEIL,0/(E,:£,). VEALOJE¡L), .... WEE, 0,(E,:L,)) y 
por consiguiente es realizable si 2, es realizable. Por lo tanto, si cada sub- 
conjunto finito de 2 es realizable, también cada matriz =, es realizable. Por 
un argumento análogo al aducido en la fase semántica de la prueba del Teo- 
rema II se concluye finalmente que si cada matriz =, es realizable, el con- 
junto 2 es realizable. 

Del Teorema X se sigue inmediatamente el siguiente corolario: Si X es un 
conjunto numerable de fórmulas del CP1=, o bien * es realizable, o bien Y 
incluye un subconjunto finito de fórmulas XA.;,...,a,y tal que Ay A... A 
aL, es refutable (Teorema IX; Gódel 1930, p. 357; también en la tesis, $ 8, 
CW, I, 96ss.). Como Gódel expresamente señala, esto significa que, si 2 es 
el conjunto finito o numerablemente infinito de los axiomas de una teoría 
matemática expresable en el CP1=, se cumple una de estas alternativas: o 
bien (1) la teoría es inconsistente y se puede deducir una contradicción en un 
número finito de pasos de un número finito de premisas contenidas en 2; o 
bien (11) hay un modelo —una realización— de la teoría. En una nota, Gódel 
cita como ejemplo la teoría de los Grundlagen der Geometrie de Hilbert, 
“sin los axiomas de continuidad” (que no se pueden expresar en un cálculo 
de primer orden).?% De este modo, el corolario citado resuelve, al menos para 
este fragmento de la teoría geométrica, la disputa entre Hilbert y Frege a 
que me referí en el Capítulo 2.1. Hilbert había escrito a Frege, algo liviana- 
mente, que “si los axiomas arbitrariamente estipulados, junto con todas sus 
consecuencias, no se contradicen entre sí, entonces son verdaderos y existen 
las cosas definidas por ellos: ése es para mí el criterio de la existencia y de 
la verdad” (Frege, KS, p. 411; vide p. 118). En este pasaje, Hilbert posible- 
mente decía “existencia? sólo como una manera de hablar, pero la prueba de 
Gódel le devuelve a la palabra su sentido literal: si la teoría es sintácticamente 


Los axiomas de continuidad forman el grupo V en Hilbert, GG. Son el Postulado de 


Arquímedes (si a y b son las distancias entre dos pares de puntos, hay un entero n tal 
que na > b) y el llamativo Axioma de completud (V,2) agregado por Hilbert en 1902, 
en virtud del cual ninguna parte propia de un modelo de los axiomas puede a su vez 
ser un modelo. Vide supra, p. 99, nota 27. 
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consistente, también tiene un modelo que la realiza. Irónicamente, el modo 
no constructivo de razonar empleado por Gódel, aunque cuestionable para un 
hilbertiano estricto (vgr. Herbrand), no le hubiera merecido reparos a Frege.? 

El artículo de Gódel contiene otra observación metodológica —ausente 
en la tesis— que debe haber caído muy bien en la escuela de Hilbert: 


Adviértase que, con vistas al Entscheidungsproblem, la equivalencia “vá- 
lido = deducible” que ha quedado demostrada entraña una reducción de 
lo no numerable a lo numerable, puesto que “válido” se refiere al conjun- 
to no numerable de las funciones [proposicionales], mientras que “dedu- 
cible” sólo presupone el conjunto numerable de las pruebas. 

(Gódel 1930, p. 356) 


Aparentemente, cuando se tomó la molestia de anotar este “avance” hacia la 
solución positiva del Entscheidungsproblem, Gódel no sospechaba que su 
próximo descubrimiento (1930a, 1931) daría al traste con toda esperanza de 


za En la tesis, Gódel anuncia desde un comienzo este resultado, y se apresura a destacar 


su interés filosófico. Después de anunciar su propósito en el texto de CW, I, 60 que 
cité en la nota 3, prosigue: “Se reconocerá fácilmente que esta aseveración equivale a 
la siguiente: Todo sistema axiomático consistente que conste exclusivamente de [fór- 
mulas del cálculo predicativo de primer orden] tiene una realización (Realisierung). 
(Consistente (widerspruchslos) quiere decir aquí que ninguna contradicción puede de- 
rivarse mediante un número finito de inferencias formales). La última formulación parece 
tener cierto interés de por sí, pues la solución de esta cuestión constituye en cierto 
sentido un complemento teórico del método usual de las pruebas de consistencia (por 
cierto que sólo para el género especial de sistemas axiomáticos aquí considerado), pues 
ofrecería una garantía de que este método en todo caso conduce a la meta, es decir, 
que o bien tiene que ser posible producir una contradicción, o bien la consistencia 


tiene que poderse demostrar mediante un modelo” (Gódel, CW, L, 60). 


en En todo caso, Gúdel siguió interesado en el Entscheidungsproblem después de 1931. 


Gódel 1932 prueba que hay un algoritmo para decidir la realizabilidad de cualquier 
fórmula prenexa de primer orden cuyo prefijo contenga a lo sumo dos cuantificadores 
universales entre dos filas de cuantificadores existenciales, esto es, cualquier fórmula 
de la llamada clase 3...3WW3...3. Este resultado de Gódel mejora el de Ackermann 
1928, quien probó que las fórmulas de la clase 3...3VW3...3 son decidibles. Gódel 1932 
demuestra asimismo que el Entscheidungsproblem quedaría resuelto positivamente si 
hubiera un algoritmo para decidir la realizabilidad de la clase WWW2...3 (prefijo con 
tres cuantificadores universales seguidos de una fila de existenciales). Esto podía verse 
como un avance enorme hacia la solución del problema general o —según lo entende- 
mos ahora— como una prueba de que la clase WWWJ3...3 es indecidible. 


2.8 El cálculo predicativo de primer orden es completo 293 


alcanzarla. Mas, para nosotros que ya lo conocemos, algunas de sus re- 
flexiones parecerían anticiparlo. Algunos pensarán —dice Gúdel en la intro- 
ducción a la tesis— que “la existencia de los conceptos introducidos me- 
diante un sistema de axiomas ha de definirse justamente por su consistencia 
(Widerspruchslosigkeit). 3! 


Pero esta definición —con sólo que uno exija, como es obvio, que el 
concepto de existencia así introducido obedezca a las mismas reglas de 
operación que el elemental — presupone evidentemente el axioma de la 
solubilidad de todo problema matemático. Pues si se demostrara la insolubi- 
lidad de algún problema (relativo, digamos, al dominio de los números 
naturales), de esto se desprendería conforme a dicha definición que exis- 
ten dos realizaciones no isomórficas del sistema axiomático de los núme- 
ros reales, mientras que, por otra parte, se puede demostrar el isomorfis- 
mo que cualquier par de realizaciones. Pero la demostración de la 
insolubilidad de un problema no se puede excluir de antemano, si se piensa 
que hablamos sólo de insolubilidad con ciertos modos de inferencia for- 
mal precisamente señalados. Pues todos los conceptos que vienen a cuen- 
to aquí (demostrable, consistente, etc.) sólo tienen un sentido exacto si se 
deslindan con precisión los modos de inferencia permitidos. 

(Gódel, CW, L 60-62; cursiva mía)?? 


El artículo aborda brevemente la cuestión de la independencia de los axio- 
mas 1-8. Recuerda que Bernays (1926) ya había probado que ninguno de 
los axiomas 1-4 puede deducirse de los otros tres. Obviamente, su indepen- 
dencia no se altera al agregar los axiomas 5-8. Para mostrar que también 
éstos son independientes —en el sistema total — Gúdel opera sustituciones o 
adopta postulados que, en cada caso, invalidan a uno de ellos sin afectar la 


E De paso señalo que el pronombre posesivo “ihre” (“de ellos” o “de ella”) que precede a 


“Widerspruchslosigkeit'” (“ausencia de contradicción”, arriba traducido “consistencia”) sólo 
puede referirse al sustantivo plural *Begriffe” (“conceptos”) o al femenino singular 
“Existenz” (“existencia”), y no al neutro singular *Axiomensystem” (“sistema de axio- 
mas”) como cree el traductor inglés (Gódel, CW, I, 61). Por lo demás, en el texto ale- 
mán “Begriffe” está más cerca de “ihre” que los otros dos sustantivos. Habría que expli- 
car, claro está, qué significa la “ausencia de contradicción” de un grupo de conceptos. 


Por esto, he preferido dar una traducción ambigua. 


da En el original sólo van en cursiva las palabras correspondientes a “formal precisamente 


señalados”. 
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validez de los restantes (y tampoco, por ende, la de las fórmulas deducibles 
de éstos). Por ejemplo, para mostrar que 8 no se deduce de 1—7 postula que 
VxVy(x = y), lo que hace falso a 8 en cualquier dominio con dos o más 
objetos, pero es perfectamente compatible con 1—7. En el pasaje paralelo de 
la tesis Gódel examina asimismo la indispensabilidad de las cuatro reglas de 
inferencia, aunque algo apresuradamente, me parece (de modus ponens y la 
regla de sustitución de variables no dice más que esto: “que las reglas 1 y 2 
no son superfluas es algo perfectamente trivial (ist ja vollkommen trivialy” — 
CW, L 96). En ninguno de estos textos se sugiere ni por un instante que la 
independencia de los axiomas de la lógica abra la posibilidad de contemplar 
lógicas alternativas. Sólo se trata de mostrar que los principios cuya sufi- 
ciencia para deducir todas las verdades lógicas enunciables en el CP1= ha 
quedado establecida son también imprescindibles para ello. Al fin y al cabo, 
si la mera deducibilidad en un sistema formal arbitrario fuese un criterio de 
verdad lógica (“en el sistema”) el problema resuelto por Gódel en la parte 
principal de estos trabajos no tendría sentido. 


2.9 EL PROGRAMA DE HILBERT 
VISTO MÁS DE CERCA 


Se dice comúnmente que el segundo gran descubrimiento de Gódel —sus 
famosos teoremas de “incompletud” (1930a, 1931)— significa el fracaso del 
programa de Hilbert. Estudiaremos el hallazgo de Gódel y sus consecuen- 
cias más directas en los Capitulos 2.10 y 2.11. Pero para juzgar su efecto 
sobre el programa de Hilbert conviene primero examinar los términos en que 
él mismo lo explicaba y promovía hasta fines de 1930, antes del shock cau- 
sado por Gódel. 


2.9.1 Axiomatización y formalización 


En los planes de Hilbert para fundamentar sólidamente las matemáticas hay 
dos aspectos que suelen confundirse: la axiomatización y la formalización. 
Mediante la axiomatización de una teoría matemática —como la practican 
ejemplarmente Pasch (1882) y Hilbert (1899, 1900)— se trata de caracteri- 
zar exhaustiva y definitivamente el objeto de la misma mediante una lista de 
enunciados —los axiomas y definiciones— de suerte que todo lo que la teo- 
ría tenga que decir acerca de dicho objeto se pueda demostrar razonando a 
partir de esa lista. Mediante la formalización —según la concibe y ejecuta 
Frege (1879, 1893, 1903)— se trata de representar las aseveraciones de la 
teoría en una “escritura conceptual” de sintaxis sencilla y rigurosa, diseñada 
para facilitar la presentación de los razonamientos demostrativos en una for- 
ma canónica, fácilmente controlable. 

Esta descripción sumaria nos da criterios para medir los aciertos y los 
límites de una axiomatización o una formalización. Consideremos una teoría 
matemática tradicional cualquiera, por ejemplo, la geometría euclidiana or- 
dinaria que Hilbert axiomatizó en 1899. La llamaré . Todo lo que 8 tiene 
que decir sobre su objeto, es decir, todos los teoremas de “8 se pueden, por 
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cierto, demostrar razonando a partir del solo axioma siguiente: “cero no es 
idéntico a cero” (sea lo que fuere el objeto aquí denominado *cero”). Pero 
este axioma implica también la negación de cada uno de esos teoremas. Para 
que caracterice a 8, es necesario que la lista de axiomas propuesta sea consis- 
tente: si implica una cierta aseveración p, no debe implicar la negación de p. 
Por otra parte, la consistencia de la lista de axiomas no es suficiente para 
caracterizar a 8. Es preciso además que ella sea completa, esto es, que im- 
plique todos los teoremas de . Hilbert menciona estos dos requisitos de una 
buena axiomatización a propósito, justamente, de su propia axiomatización 
de € (1900, en GG”, p. 242). El requisito de consistencia es crítico e insos- 
layable. Pero el requisito de completud se puede trivializar —en el caso de 
una teoría nueva o de una tradicional cuyo alcance se disputa— decretando 
que el objeto de la teoría que se pretende axiomatizar es precisamente aque- 
llo que los axiomas caracterizan. Es lo que hace Hilbert a propósito de los 
números reales. En la segunda mitad del siglo XIX éstos habían sido defini- 
dos por Cantor y otros autores de varias maneras que apelaban a la existen- 
cia de colecciones infinitas bien determinadas de números racionales (cf. 
Capítulo 1.3). Kronecker negaba que hubiera tales colecciones. Hilbert (1900) 
coge el toro por las astas: formula una lista de cuatro grupos de axiomas 
que caracterizan lo que hoy se llama un cuerpo ordenado, completo y 
arquimédico (el lector que no conozca este concepto debe ahora mismo con- 
sultar el Glosario, s.v. cuerpo”) y propone la estipulación siguiente: 


En adelante no debemos entender por “el conjunto de los números reales” 
algo así como la totalidad de todas las leyes posibles conforme a las cua- 
les se suceden los elementos de una secuencia fundamental [definida en 
la p. 16—R.T.], sino más bien —como acaba de explicarse— un sistema 
de cosas cuyas relaciones mutuas están dadas por el sistema finito y ce- 
rrado de los Axiomas IV, y sobre las cuales valen nuevas aseveraciones 
solamente si se las puede derivar de esos axiomas mediante un número 
finito de inferencias lógicas. 

(Hilbert 1900, en GG”, p. 246) 


La frase de Hilbert “derivar de esos axiomas mediante un número finito de 
inferencias lógicas” (“mittels einer endlichen Anzahl von logischen Schliissen 
aus jenen Axiomen ableiten”) corresponde a la que usé arriba: “demostrar 
razonando a partir de [ellos]”. Años más tarde, Hilbert ridiculizará a quienes 
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“subrayan la exigencia de que en la matemática rigurosa se permite en una 
demostración sólo un número finito de inferencias —como si ya alguien hu- 
biese logrado ejecutar una vez infinitas inferencias” (1925, p. 162). Esta ati- 
nada observación no se hace cargo, empero, de la vaguedad inherente a la 
idea misma de un número de inferencias. Pues ¿qué es una inferencia? To- 
dos hemos pasado por la experiencia de oir o leer a un profesor de matemá- 
ticas que declara “inmediato” el paso de unas premisas a una conclusión que 
no nos parece nada de evidente. Si luego, con trabajo, conseguimos enten- 
derlo, será porque logramos analizarlo en varias inferencias que sí son sim- 
ples para nosotros. 

La formalización de las matemáticas elimina la incertidumbre de tales análi- 
sis. En la matemática formalizada, cada razonamiento correcto se representa 
—como hemos visto— mediante una listas de fórmula que se suceden unas 
a otras conforme a ciertas reglas de cómputo, y cada aplicación simple de 
una de estas reglas cuenta como una inferencia. Pero Hilbert ve en la 
formalización, sobre todo, un camino para asegurar el cumplimiento del re- 
quisito de consistencia. Él había probado (en GG, $ 9) que su teoría axiomá- 
tica de la geometría era por lo menos tan consistente como la aritmética (in- 
cluida la teoría de los números reales). Pero en el caso de la aritmética mis- 
ma evidentemente no cabe apelar a la consistencia de otra teoría más funda- 
mental. 


2.9.2 Balbuceos formales (Hilbert 1904) 


Hilbert esboza —muy imperfectamente— una formalización de la aritmética 
en su conferencia “Sobre los fundamentos de la lógica y la aritmética” (1904). 
Empieza explicando las dificultades de una fundamentación de la aritmética 
a través de un breve comentario crítico de las opiniones de seis autores: 
Kronecker, Helmholtz, Christoffel, Frege, Dedekind y Cantor. Hilbert conce- 
de al primero el mérito de haber visto “en el concepto del número entero el 
fundamento genuino de la aritmética”. Pero Kronecker pensaba que el nú- 
mero entero nos estaba dado directa e inmediatamente como concepto gene- 
ral, lo cual le impidió reconocer que ese concepto necesita y admite una 
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fundamentación.' Helmholtz sustentaba una filosofía empirista de la aritmé- 
tica, que según Hilbert queda refutada por cuanto “nunca se podrá colegir 
de la experiencia —vale decir, mediante un experimento— la posibilidad o 
la existencia de un número arbitrariamente grande”, dado que “el número de 
las cosas que son objeto de nuestra experiencia, por grande que sea, es menor 
que cierta cota finita” (GG”, p. 248). Hilbert nombra a Christoffel como el 
principal de los “oportunistas” que entendieron correctamente que los irracio- 
nales eran indispensables para el análisis y defendieron su existencia contra 
Kronecker, sin lograr refutarlo. 

Para Hilbert, los tres autores restantes son quienes “han calado más hon- 
do en la esencia del número entero”. Frege, que se propuso “fundar las le- 
yes de la aritmética por medio de la lógica, concebida en el sentido tradicio- 
nal”, tiene el mérito de “haber reconocido correctamente las propiedades esen- 
ciales del concepto de número entero así como el significado de la inferen- 
cia por inducción completa”. Pero su intento naufraga en paradojas debido a 
que Frege (1) da por supuesto que “un concepto (un conjunto) se ha definido 
y se puede utilizar inmediatamente en cuanto se haya determinado para cada 
objeto si cae o no bajo el concepto” y (11) “no somete el concepto “todo” 
(jeder”) a restricción alguna”. El fracaso de Frege muestra que “las concep- 
ciones y medios de investigación de la lógica, concebida en sentido tradicio- 
nal, no están a la altura de las rigurosas exigencias de la teoría de conjun- 
tos”. Hilbert proclama enfáticamente que “las investigaciones sobre el con- 
cepto de número tienen que proponerse de antemano como una meta princi- 
pal evitar tales contradicciones y aclarar esas paradojas”? En la obra de 


Más tarde, Hilbert describirá a Kronecker como su precursor más directo: éste “formu- 
ló claramente y dilucidó con numerosos ejemplos una concepción que hoy coincide en 
lo esencial con nuestra postura finita” (Hilbert 1931, p. 487). Como bien señala Bernays, 
el acuerdo que Hilbert percibe entre su propio modo de pensar y el de Kronecker es- 
triba “especialmente en el concepto intuitivo de numeral y en el reconocimiento de 
que la forma intuitiva de la inducción completa, esto es, el modo de inferencia que se 
basa en la representación intuitiva de la “construcción” de los numerales, es evidente y 
no requiere ulterior fundamentación” (1935, p. 203). Sobre la diferencia entre dicha 
“forma intuitiva de la inducción completa” y la inducción matemática irrestricta, véase 
más adelante la nota 15. 

El párrafo dedicado a Frege figura en Hilbert, GG”, pp. 248s. Sorprende que Hilbert 


creyera que Frege concebía la lógica “en sentido tradicional” (in hergebrachtem Sinne). 
Merece atención la sugerencia de que las paradojas vienen de la aceptación indebida 
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Dedekind, Hilbert destaca el método “trascendental” aplicado a la demostra- 
ción de la existencia del infinito (bosquejada arriba, en la p. 154, nota 12). 
Porque esa demostración recurre al concepto —contradictorio— de la totali- 
dad de las cosas, Hilbert se niega a aceptarla como “viable y segura”. Por 
último, Cantor sintió la contradicción y expresó, según Hilbert, ese senti- 
miento al distinguir entre “conjuntos (Mengen) “consistentes” y “no consis- 
tentes””; pero no basó este distingo en ningún criterio preciso, con lo cual 
“deja libertad al arbitrio subjetivo y por ende no provee una seguridad obje- 
tiva”.? 

Completado este panorama, Hilbert declara estar convencido de que “las 
dificultades mencionadas se dejan superar y que es posible lograr una funda- 
mentación rigurosa y plenamente satisfactoria del concepto de número” 
mediante un método que él llama axiomático. A la luz del bosquejo presen- 
tado en el resto de la conferencia, es claro que se trata de un intento, todavía 
balbuceante, de formalización de la aritmética de los enteros positivos. No 
es posible reproducirla aquí en todos sus detalles,* pero vale la pena llamar 
la atención sobre algunos de ellos. La exposición de Hilbert comienza con 
la siguiente estipulación: 


Llámese cosa pensada (Gedankending) o, brevemente, cosa (Ding) a un 
objeto de nuestro pensamiento y nómbresela mediante un signo. 
(Hilbert 1904, en GG”, p. 250) 


Hilbert propone la consideración de cinco cosas, nombradas mediante los 
signos 1, =, u1, f, y f'. Estas cosas —que luego (p. 255) llama “simples”— 
se combinan en lo que, si damos por supuesto el concepto de número natu- 
ral finito, describiríamos sin vacilar como n-tuplos o listas. Pero Hilbert quiere 


de ciertos conceptos, no de la suposición injustificada de que cualquier concepto cons- 
tituye un conjunto, esto es, un objeto que a su vez es concebible y por ende —bajo 
dicha suposición— es elemento de algún conjunto. 

S Hilbert 1904, en GG”, pp. 249. Como vimos en el Capítulo 1.6, Cantor hablaba de 
pluralidades (Mannigfaltigkeiten) consistentes e inconsistentes. Sólo las consistentes son 
conjuntos (Mengen). Es curioso que Hilbert desdeñara cuando hacía historia la exacti- 
tud que juzgaba indispensable en matemáticas. 


Hay una traducción inglesa de Hilbert 1904 en van Heijenoort 1967, pp. 129-138. 
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tal vez evitar ese supuesto? y se limita por eso a ilustrar tales combinaciones 
de cosas mediante concatenaciones de los signos que las nombran, sin la más 
mínima indicación de cómo hay que entenderlas. He aquí sus ejemplos: 


E OA 
1=1,(1D=00) 


La coma y los puntos suspensivos se usan para separar distintos ejemplos, y 
el espacio en blanco que a veces precede o sigue al signo = sirve, me ima- 
gino, sólo para facilitar la lectura. Pero los paréntesis ) y ( obviamente for- 
man parte de la combinación de signos que nombra una dada combinación 
de cosas, aunque Hilbert no dice como se usan, ni siquiera los introduce 
formalmente. Hilbert nos invita enseguida a “pensar que las combinaciones 
de esas dos cosas simples se reparten en dos clases, la clase de los existen- 
tes (der Seienden) y la de los no-existentes (der Nichtseienden)” (GG”, p. 
251). Si a es una concatenación de signos que nombra una combinación, a 
significa también el enunciado de que la combinación nombrada por a per- 
tenece a la clase de los existentes y a significa el enunciado de que dicha 
combinación pertenece a la clase de los no-existentes. El enunciado a es 
correcto (richtig) si la combinación a efectivamente pertenece a la clase de 
los existentes, pero sí ella pertenece a la clase de los no-existentes es co- 
rrecto el enunciado a. Los enunciados a y a constituyen —dice Hilbert— 
una contradicción. 

Hilbert enseña luego a formar un enunciado nuevo a partir de dos enun- 
ciados dados intercalando entre éstos el signo o. y el signo u. (que funcio- 
nan, respectivamente, como el signo de disyunción v y el signo de conjun- 
ción A). Si A y B son enunciados, AlB se lee “de A se sigue B” o “si A es 
correcto, también es correcto B”. Esta explicación y el empleo ulterior del 
signo | en la formulación de reglas de inferencia (GG”, p. 260) sugiere que 
dicho signo corresponde a nuestro símbolo (metalingiístico) de deducibilidad 
F. Pero Hilbert trata a AlB como enunciado formal, en que el signo | corres- 
ponde a nuestra flecha >. Curiosa es también la forma como Hilbert intro- 


Más adelante Hilbert reconoce, sin embargo, que para demostrar la consistencia del 
sistema formal esbozado necesitará el concepto de número ordinal finito (GG”, p. 255). 
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duce lo que hoy llamaríamos cuantificadores. Si A(x) es un enunciado en 
que uno o más símbolos que designan cosas se han reemplazado por la va- 
riable x y A, A,, Ay, ... es una lista de todos los enunciados diferentes que 
pueden formarse reemplazando uniformemente x en A(x) por una con- 
catenación de signos 1 y =, entonces A(x”) representa la disyunción infinita 
A¡ VA, vAj,v ... y se lee “por lo menos para un x, 4” y A(x") representa 
la conjunción infinita A, AA, AAz A ... y se lee “para cada x, A”. 

A continuación, Hilbert postula cinco “axiomas”. Son concatenaciones de 
los cinco signos 1, =, u, f, y F' y una o más de las letras x, y, w (w figura 
sólo en las combinaciones w(x) y w(y)). El uso de estas letras se explica así: 
x €e y representan a uno de los signos 1 y =, o una combinación cualquiera 
de estos signos; w(x) representa una combinación arbitraria de los cinco sig- 
nos que contiene la combinación de los signos 1 y = representada por la 
letra x. He aquí los axiomas, tal como Hilbert los escribe: 


1 X= Xx 

2 x = y u. wWo0y | w(y) 

3 Fx) = u(fx) 

4 fo = fy | ux = uy 
lo) (ux) = ul 


El original es menos claro que mi paráfrasis. Lo cito a continuación, en aras de la 
exactitud histórica. Adviértase que en las páginas que preceden a este pasaje Hilbert no 
ha mencionado en ningún momento la posibilidad de que un enunciado (Aussage) con- 
tenga una variable (Willkiirliche): 


Wir wollen unter A, A», Az,... diejenigen Aussagen verstehen, die —kurz 
ausgedriickt— aus einer Aussage A(x) hervorgehen, indem wir an Stelle der 
»Willkirlichen* x die Gedankendinge 1, =, und die Kombinationen derselben 
nehmen; dann schreiben wir die Aussagen 


A¡0.A20.43,... bzw. A,u. A) u. Az, ... 
auch wie folgt: 


A(x), in Worten: ,wenigstens fiir x“* 
bzw. —A(x9), in Worten: ,,fiir jedes einzelene x“; 


hierin erblicken wir lediglich eine abkiirzende Schreibweise. 
(Hilbert 1904, en GG”, p. 252) 
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Se trata, evidentemente, de lo que hoy llamamos esquemas. Los axiomas pro- 
piamente tales serán las infinitas concatenaciones de signos que pueden for- 
marse reemplazando x, y, w(x) y w(y) según las indicaciones ofrecidas. Por 
eso desconcierta leer que 1 y 2 son “enunciados (Aussagen)” que conjunta- 
mente “constituyen la definición del concepto = (igual)” (GG”, p. 252). Las 
explicaciones dadas por Hilbert acerca de los tres restantes sugieren que ellos 
deben hacer las veces de los axiomas P1-P4 de Peano (Sección 2.3.1). Los 
objetos 1, f, y f' se llaman, respectivamente “conjunto infinito (unendliche 
Menge)”, “siguiente (Folgendes)” y “operación concomitante (begleitende 
Operation)”. La combinación ux “se llama” un elemento del conjunto infini- 
to u. 


Entonces, el axioma 3 expresa que a cada elemento ux le sigue una de- 
terminada cosa pensada f(11x), que es igual a un elemento del conjunto u, 
a saber, al elemento 1u(f'x), que también pertenece al conjunto u. El axio- 
ma 4 expresa el hecho de que, si los elementos que siguen a dos elemen- 
tos del conjunto 11 son iguales, esos dos elementos también son iguales. 
Conforme al axioma 5 no hay en 1 ningún elemento al que siga el ele- 
mento ul; por eso este elemento ul se llama el primer elemento de 1. 
(Hilbert 1904, en GG”, p. 254) 


Es difícil imaginarse cómo Hilbert esperaba fundamentar la aritmética con 
estos cinco (tipos de) axiomas y las dos reglas de inferencia que formula 
explícitamente.” Pero la idea central de su programa para una prueba directa 
de consistencia ya se insinúa claramente. Subraya que el axioma 53 es el único 
con la forma a, propia de un enunciado que adjudica una combinación de 
objetos simples a la clase de los no existentes. El sistema sería inconsistente 
si permitiera inferir un enunciado que adjudicara a la clase de los existentes 
una de las combinaciones así clasificadas por 5; esto es, si permitiera inferir 
el enunciado f(ux) = 11. Ahora bien, este enunciado ciertamente no es lo 


Para mayor claridad, doy las dos reglas en nuestro simbolismo: (1) de ((a > b) a (=a 
> b)) inferir b; (11) de ((a v b) a (a v c)) inferir (a v (b a c). Adviértase que ninguna 
de las dos envuelve expresiones con cuantificadores. Tampoco hay una regla de susti- 
tución, pero esto es natural si todos los axiomas se dan en la forma de esquemas. 


Hilbert dice que “los enunciados que forman con 5 una contradicción tienen que ser 
[...] de la forma: 6 f(ux0) = 11” (GG”, p. 254). Si el cuantificador existencial con- 
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que Hilbert llama una ecuación homogénea, esto es, una combinación de la 
forma a = b, en que a y b son n-tuplos de objetos simples (para un mismo 
n). En virtud de esto, para completar la prueba de consistencia basta demos- 
trar que de los axiomas 1-4 no puede inferirse ninguna ecuación que no sea 
homogénea. Para efectuar dicha demostración hacen falta, según Hilbert, el 
concepto de número ordinal finito y ciertos teoremas sobre el concepto de 
equinumerosidad que —nos dice— pueden formularse y derivarse sin esfuerzo 
(ohne Miihe). Seguramente tiene razón. En los años 20 —como ya hemos 
visto— varios discípulos de Hilbert probarán rigurosamente y sin dificultad 
la consistencia del muñón de aritmética basado en los axiomas P1-P4 de 
Peano.? 


tenido en 6 se concibe a nuestro modo, es claro que (a diferencia de 5) 6 no es una 
mera “forma” de enunciado (un esquema), sino un enunciado genuino. Pero no pode- 
mos saber con precisión cómo lo concebía Hilbert en 1904. 


Hilbert 1904 concluye con ciertos “principios normativos de la construcción y ulterior 
desarrollo de las leyes del pensamiento matemático en la forma proyectada”, numera- 
dos del I al V. Se trata más bien de consideraciones metodológicas. Doy enseguida una 
paráfrasis abreviada. I. Cualquier enunciado debe reconocerse como correcto en cuanto 
se establezca que no resultará una contradicción al añadirlo como axioma a los enun- 
ciados probadamente correctos. (Según Hilbert esto expresa el principio creador que 
nos autoriza a formar libremente conceptos nuevos sin otra restricción que la de evitar 
las contradicciones). II. En los axiomas, el recorrido de las variables de cuantificación 
se limita a las cosas que se dieron inicialmente por sentadas y sus combinaciones, así 
como a las cosas que luego se definan en términos de aquéllas. (Se recordará que en el 
malogrado sistema de Frege, cada variable de cuantificación recorría supuestamente la 
totalidad absoluta de las cosas). III. Al revés de la concepción corriente (a principios 
de siglo), el concepto de elemento de un conjunto depende del concepto de conjunto: 
“El conjunto se define en general como una cosa pensada m y las combinaciones mx 
se llaman elementos del conjunto m” (GG”, p. 258). IV. Al investigar un dado sistema 
de axiomas con arreglo a estos principios hay que repartir en dos clases las combina- 
ciones de las cosas que se dieron por sentadas, la clase de los existentes y la de los no- 
existentes, tratando a los axiomas como prescripciones que esta clasificación tiene que 
satisfacer. V. Cuando se habla en plural de cosas pensadas y sus combinaciones, de 
variables, de clases de combinaciones, uno se refiere siempre a un número limitado de 
tales objetos. 
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2.9.3 Teoría de la prueba 


»Wir kennen die Unendlichkeit aus der 
Beschreibung.« Nun, dann gibt es eben 
diese Beschreibung und nichts sonst. 


»Conocemos lo infinito por la descrip- 

ción.< Bien, entonces lo que hay es jus- 

tamente esa descripción y nada más. 
WITTGENSTEIN, PB $ 136 


Hilbert nunca elaboró en detalle la formalización de la aritmética esbozada 
en su conferencia de 1904.!% Su próxima publicación sobre el tema —“Pensa- 
miento axiomático” (1918)— remite a la obra de Russell, que propone com- 
pletar con una prueba de consistencia. En este escrito —una conferencia pro- 
nunciada en Zurich en septiembre de 1917— “método axiomático” no es un 
sinónimo de “formalización” (como en Hilbert 1904), sino, como es justo, de 
lo que he llamado “axiomatización”. Hilbert señala que los hechos com- 
prendidos en el campo de estudio de cualquier especialidad científica se or- 
denan con ayuda de “un cierto andamio de conceptos (Fachwerk von Be- 
griffen) de tal modo que al objeto particular del campo de estudios le co- 
rresponde un concepto de ese andamiaje y a cada hecho dentro del campo 
de estudios le corresponde una relación lógica entre los conceptos” (Hilbert 
1918, en GA III, 146). Dicho andamio conceptual es la teoría de ese campo. 
Su construcción descansa en “unas pocas aseveraciones destacadas, [que] bas- 
tan por sí solas para construir a partir de ellas todo el andamio, conforme a 
principios lógicos” (GA III, 147). Tales aseveraciones son los axiomas de la 
teoría. Para que la teoría sirva de veras para ordenar los hechos y orientar el 
pensamiento es menester, según Hilbert, hacerse una idea acerca de la mu- 
tua dependencia e independencia de sus aseveraciones y tener una garantía 


Bernays 1935, p. 200, n. 1, observa que el matemático húngaro Julius Kónig, en su 
inconclusa Lógica sintética —publicada póstumamente como Nuevos fundamentos de 
la lógica, aritmética y teoría de conjuntos (Kónig 1914)— continúa la línea de inves- 
tigación iniciada en Hilbert 1904. Bernays agrega que con esa obra Kónig fue un pre- 
cursor de la teoría de la prueba, pero que ella no ejerció ninguna influencia sobre Hilbert. 
En cambio, el estudio del húngaro von Neumann “Sobre la teoría hilbertiana de la 
prueba” (1927) sí se vincula a la obra de Kónig. 
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de su consistencia (Widerspruchslosigkeit). Hilbert cita varios ejemplos de 
dependencia e independencia de asertos en teorías conocidas!! y aborda lue- 
go la cuestión de la consistencia, cuya “suprema importancia” es patente, 
pues “la presencia de una contradicción en una teoría obviamente pone en 
peligro la subsistencia de toda la teoría” (GA II, 150). Hilbert alude una 
vez más a las pruebas de consistencia relativa —como la que demuestra que 
su teoría axiomática de la geometría no puede contener contradicciones si la 
teoría de los números reales es consistente— y recuerda que Weierstraf y 
Dedekind, empleando conceptos conjuntistas, lograron reducir la consisten- 
cia de la teoría de los reales a la consistencia de la teoría de los enteros. 
Pero en el caso de la teoría de los enteros y de la teoría de conjuntos ese 
procedimiento de reducción a una teoría diferente es inviable “porque fuera 
de la lógica no hay ninguna otra disciplina a la que uno pueda entonces 
apelar” (GA III, 153). Como “el examen de la consistencia es una tarea in- 
soslayable” habrá que “axiomatizar la lógica misma y demostrar que la teo- 
ría de los números y la teoría de conjuntos sólo son partes de la lógica”. 
Esta tarea, preparada por “las profundas investigaciones de Frege”, ha sido 
acometida con muchísimo éxito por “el agudo matemático y lógico Russell”. 


En la consumación de esta grandiosa empresa russelliana de la axioma- 
tización de la lógica podría verse la coronación de la obra de la axiomati- 
zación en general. Pero esa consumación demandará aún nuevas y variadas 
labores. Una consideración más atenta nos revela enseguida que en el caso 
de los números enteros y los conjuntos la cuestión de la consistencia no 


Hilbert destaca especialmente la independencia del Postulado de Arquímedes en la fí- 
sica: “El hecho de que añadiendo distancias terrestres alcancemos las dimensiones y 
distancias entre los cuerpos en los espacios siderales [... ], así como el hecho de que 
las distancias en el interior del átomo se puedan expresar en metros, no son de ningún 
modo una mera consecuencia lógica de los teoremas sobre congruencia de triángulos y 
la configuración geométrica, sino un resultado de la investigación empírica” (GA II, 
149). La siguiente versión del Postulado expresa bien, según él, la forma como los 
físicos lo han utilizado siempre, aunque sin mencionarlo: 


Si se le asigna un cierto grado arbitrario de precisión a la validez de un enunciado 
físico, es posible indicar pequeños dominios (Bereiche) dentro de los cuales las 
condiciones del enunciado pueden variar libremente sin que la discrepancia resul- 
tante exceda la imprecisión admisible. 

(Hilbert 1918, en GA III, 150] 
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está aislada sino que pertenece a un vasto repertorio de dificilísimas cues- 
tiones epistemológicas de específica coloración matemática. Menciono, para 
caracterizar brevemente este campo de problemas, la cuestión de la 
solubilidad en principio de todo problema matemático, el problema de la 
posibilidad ulterior de controlar el resultado de una investigación mate- 
mática, también la pregunta por un criterio de simplicidad de las demostra- 
ciones matemáticas, la cuestión de la relación entre sustantividad (Inhalt- 
lichkeit) y formalismo, y por último el problema de la decidibilidad de 
una cuestión matemática mediante un número finito de operaciones. 
(Hilbert 1918, en GA III, 153) 


Los problemas que Hilbert enumera se han comentado en los capítulos 
anteriores. Forman parte, según él, del tema de una disciplina matemática 
especial. Para dominarlo “debemos investigar el concepto mismo de la prue- 
ba específicamente matemática (den Begriff des spezifischen mathematischen 
Beweises): así como el astrónomo tiene en cuenta el movimiento de su ob- 
servatorio, el físico debe prestar atención a la teoría de su aparato y el filó- 
sofo critica a la razón misma” (GA III, 155). Esta es la disciplina que más 
tarde llamará teoría de la prueba (Beweistheorie: Hilbert 1928 en GG”, p. 
289) y también metamatemática (Metamathematik: Hilbert 1923 en GA, III, 
179). A ella pertenecen las investigaciones de Ackermann (1924), von 
Neumann (1927) y Herbrand (1929, 1930, 1931) estudiadas en los Capítulos 
2.7 y 2.8. Por esos mismos años, Hilbert difunde las ideas básicas de la teo- 
ría de la prueba y defiende su valor para la fundamentación de las matemáti- 
cas, a través de la docencia y en una serie de alocuciones en seminarios y 
congresos (1922, 1923, 1926, 1928, 1928a, 1931). En el resto de esta sec- 
ción presentaré esas ideas a la luz de estos textos, prescindiendo de los de- 
talles formales, que creo haber ilustrado suficientemente en dichos capítulos. 

Hilbert describe varias veces el “supuesto mínimo”*? indispensable para 
poner en marcha el discurso lógico-matemático (así como el pensamiento cien- 
tífico en general): 


Algo nos está ya dado de antemano en la representación; ciertos objetos 
concretos extralógicos que preceden como vivencia inmediata a todo pen- 
samiento. Para que la inferencia lógica sea segura, estos objetos tienen 


“Das geringste Ma von Voraussetzung (la mínima medida de presuposición)” — Hilbert 
1928, en GG”, p. 290. 
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que dejarse abarcar con la mirada (iúberblicken) en todas sus partes, y su 
presentación (Aufweisung), su distinción, su sucesión o concatenación (ihr 
Aufeinanderfolgen oder Nebeneinandergereihtsein) está dado directa e 
intuitivamente junto con los objetos como algo que no se deja reducir a 
otra cosa ni requiere una reducción. 

(Hilbert 1931, p. 486)!* 


A primera vista, parecería que se trata de un supuesto empírico. Es un hecho 
común que percibimos objetos que podemos distinguir, reconocer y combi- 
nar; sin ir más lejos: las letras impresas en esta página. A tono con ello, 
Hilbert propone —“en directa oposición a Frege y Dedekind”— una aritmé- 
tica cuyos objetos sean “los mismos signos, cuya figura podemos reconocer 
generalmente y con seguridad independientemente del lugar y el tiempo y 
de las condiciones particulares de la producción del signo, así como de dife- 
rencias insignificantes en su ejecución” (1922, en GA III, 163). Pero al con- 
siderar cómo Hilbert usa su “supuesto mínimo” vemos que éste rebasa los 
límites de cualquier experiencia. A continuación del último pasaje citado, da 
la siguiente definición de “número” (Zahl): 


El signo 1 es un número. 
Un signo que empieza con 1 y termina con 1 y en el cual cada 1 va se- 
guido por [el signo] + y cada + va seguido por 1 también es un número; 
ver. los signos 
1+1 
1+1+1 
(Hilbert 1922, en GA III, 163) 


Fuera de estos “signos” sin significado, que constituyen el objeto propio de 
la aritmética, Hilbert introduce signos con significado, como = y >, que sir- 
ven para trasmitir aseveraciones (además introduce abreviaturas —2, 3,... — 
que significan números). Una fórmula que consta de dos números separados 
por el signo = expresa una aseveración verdadera si y sólo si el número a la 
derecha de = reproduce el número a la izquierda. Una fórmula que consta de 
dos números separados por el signo > expresa una aseveración verdadera si 
y sólo si el número a la izquierda de > reproduce el número a la derecha 


13 Cf. 1922, en GA III, 162s.; 1926, p. 170; 1928 en GG”, pp. 289s. 
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seguido de una o más copias del signo “+1”. Tras esta concisa explicación, 
Hilbert propone usar letras góticas como numerales (Zahlzeichen), esto es 
como variables que representan números indeterminados. Demuestra luego 
el teorema siguiente: cualesquiera que sean los números Ay b,a+b=6b+ 
a. En efecto, si a = b, es claro que a+b=a+a=b + a. De otro modo, 
podemos suponer que b > a. En tal caso, hay un número c tal que b = a + 
c. Hay que demostrar, entonces, que A+ 4 +C=144+C4+ a. Pero esto es 
obvio si a + Cc =C+a. Por lo tanto, como 4 + b>b= a+ mc, el teorema 
queda demostrado para cualquier par de números (a, b) con sólo que sea 
válido para cada par (a, c) tal que a+b>a+c. 

Mediante el uso de variables que representan números cualesquiera y de 
razonamientos inductivos como el que acabo de parafrasear, Hilbert salta, 
más allá de toda “vivencia inmediata”, a la consideración de lo que pode- 
mos llamar vivencias posibles —tomando, claro está, el epíteto “posible” en 
un sentido bien amplio, no limitado por la cantidad de papel y tinta disponi- 
bles para anotar números ni por nuestra capacidad para reconocerlos y dis- 
tinguirlos cuando constan de muchas copias de los objetos primarios 1 y +.'* 
Consciente de ello, Hilbert declara que el “supuesto mínimo” arriba descrito 
no proviene de la experiencia ni del pensamiento (Erfahrung und Denken), 
sino de “una tercera fuente de conocimiento”: una “disposición intuitiva a 
priori (anschauliche Einstellung a priori)” que constituye “la condición de 
la posibilidad de todo conocimiento” (1931, p. 486). 

Esta intuición a priori hilbertiana —en contraste con la de Kant— es 
intrínsecamente finita. Su ámbito constituye el dominio propio del “punto de 
vista finito” o la “postura finita”, el suelo firme en que Hilbert cimentará la 
matemática.!* Por otra parte, la matemática como la conocemos no tiene 


Si Hilbert se atuviera a estas limitaciones y D = a + ( fuese el número más grande que 
el cerebro humano y nuestros demás recursos nos permiten escribir y leer, no podría 
pretender que 4 + hb =b + a, aunque hubiera demostrado paso a paso que A+C=(C+ 
a. 

Cf. Hilbert 1931, p. 486: “Das Apriori ist dabei nichts mehr und nichts weniger als 
eine Grundeinstellung, die ich auch als die finite Einstellung bezeichnen móchte. (El a 
priori aquí no es ni más ni menos que una postura fundamental que quisiera también 
llamar la postura finita)” Al incluir en este ámbito de saber incuestionable el tipo de 
inferencia inductiva que se usa en la demostración citada, Hilbert parece darle la razón 
a Poincaré en su polémica contra el logicismo del Frege y Russell. Poincaré rechazó el 
intento de basar la matemática en la lógica porque la edificación rigurosa de la lógica 
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escrúpulos en hablar de lo infinito. Según Hilbert, al emplear los conceptos 
“todo x” y “hay un x” ya hemos rebasado “lo concretamente intuitivo y fini- 
to” (1923, en GA III, 181). Pero estos conceptos pueden eliminarse cuando 
se refieren a un agregado finito. “La aseveración de que todos los objetos de 
una colección finita abarcable dada tienen una cierta propiedad equivale ló- 
gicamente a la reunión de muchas aseveraciones particulares mediante la 
conjunción *y” [ ... ]. Del mismo modo, la aseveración de que en una colec- 
ción finita hay un objeto con una propiedad equivale al enlace de asevera- 
ciones particulares mediante la conjunción *o”” (GA UI, 181). De esto se 
desprende inmediatamente que en cualquier colección finita, o bien todos los 
objetos tienen una cierta propiedad, o bien hay uno que no la tiene. Los 
matemáticos habitualmente dan por descontado sin más que este principio 
del “Tercero excluido” (Tertium non datur) vale también para las colecciones 


requiere la inducción matemática (Poincaré 1894, en SH, pp. 38-42; 1905/1906, en 
CM, pp. 116, 128, 131). Hilbert ya lo había comprendido en 1904 cuando propugna 
una fundamentación simultánea de la lógica y de la aritmética (GG”, p. 250; cf. 1922, 
en GA III, 174). Pero Hilbert advierte en más de una ocasión (1922, en GA III, 164; 
1928, en GG”, p. 301; 1928a, en GG”, pp. 320s.) que el género de razonamiento 
inductivo que él acepta y practica sin discusión es muy distinto de la inducción mate- 
mática basada en el axioma P5 de Peano (vide p. 146). Cuando demostramos inducti- 
vamente que 1 + b = b + a cualesquiera que sean los números (filas de signos) a y b, 
discurrimos sobre la construcción de dos filas de signos de la forma general 1 + 1 
+...+ 1. El “paso inductivo” se reduce a ver que, dada una fila q de este tipo, la fila 
Q + 1 que se obtiene añadiendo la fila +1 a la derecha de q, es idéntica a la fila 1 + q 
que se obtiene al poner la fila 1+ a la izquierda de q. Del mismo género son los razo- 
namientos por inducción sobre el número de paréntesis, o de conectivos, o de 
cuantificadores, etc. que se emplean —por ejemplo, en nuestro Apéndice IX— para 
establecer propiedades generales de las fórmulas de un cálculo lógico. Pero el axioma 
P5 de Peano autoriza inferencias mucho más ambiciosas. Sea n un cierto número y sea 
P(n) una aseveración de cualquier grado de complejidad referente a n. Sea P(x) la ex- 
presión que se obtiene al reemplazar en P(n) todas las referencias a n por referencias 
al número indeterminado r. Entonces, P5 nos permite inferir la validez de P(X), cual- 
quiera que sea el número rx, de las dos premisas siguientes: (1) P(1) y (ii) cualquiera 
que sea E, —P(X) v P(x + 1). La diferencia entre este caso y el anterior estriba en la 
complejidad de la aseveración demostrada: P(n) puede referirse mediante cuantificadores 
existenciales y universales a toda suerte de números indeterminados. Por eso, Hilbert 
considera que la legitimidad de la inferencia inductiva basada en P5 debe justificarse 
demostrando la consistencia de los axiomas de la aritmética, y que en esta demostra- 
ción cabe emplear, sin circularidad, el otro género de razonamiento inductivo . 


2.9 El programa de Hilbert visto más de cerca 310 


infinitas. Pero, “así como en el análisis está permitido transferir a sumas y 
productos infinitos los teoremas válidos para sumas y productos finitos sólo 
cuando esta inferencia está garantizada por una investigación especial de las 
condiciones de convergencia, así también, no podemos tratar las sumas y pro- 
ductos lógicos A, AA¿AAz A ... Y A¡ VA, VA; v... como si fueran 
finitos, a menos que la teoría de la prueba [ ... ] autorice este tratamiento” 
(GA Ill, 182; uso nuestro signo 'n” en vez del original *82”). 

Hilbert quiere preservar intacto el discurso matemático sobre el infinito, 
el cual está ya vindicado a sus ojos por la ausencia de contradicciones en el 
análisis clásico y por el éxito de sus aplicaciones en la ciencia natural.!% Pero 
quiere también establecer sin lugar a dudas y de una vez por todas que esa 
forma de discurso es legítima. Para eso, según él, hay que anclarlo firme- 
mente en el dominio intuitivo de la “postura finita”: “El operar con lo infí- 
nito sólo puede asegurarse a través de lo finito” (1926, p. 190; cf. 1931, p. 
488); “la libre manipulación y pleno control de lo transfinito tiene que 
alcanzarse en el terreno de lo finito” (1923, en GA Ill, 182). Para explicar lo 
que este proyecto significa, Hilbert evoca la sustitución de los infinitésimos 
de Newton y Leibniz por la “epsilóntica” de Cauchy y Weierstraf:!” 


Así como en los procesos de paso al límite en el cálculo infinitesimal se 
ha podido mostrar que lo infinito en el sentido de lo infinitamente pe- 


“Todos los héroes del espíritu antes de Gaufi, y también los que siguen a Gauf, Hermite 
y Jacobi hasta Poincaré, han empleado la inferencia transfinita en las formas más va- 
riadas y audaces, sin que nunca se haya manifestado ni la más leve discordancia. Por 
último, cuando pensamos en las aplicaciones y nos hacemos cargo de la riqueza en 
inferencias transfinitas del tipo más difícil y laborioso que albergan, por ejemplo, la 
teoría de la relatividad y la teoría cuántica y cómo, sin embargo, la naturaleza se ajusta 
precisamente a sus resultados —el rayo de luz de la estrella [curvado cuando pasa cerca 
del sol], Mercurio y los espectros más complicados aquí en la tierra y a una distancia 
de cientos de miles de años luz— ¿será posible en tales circunstancias que, a causa de 
los lindos ojos de Kronecker y unos cuantos filósofos disfrazados de matemáticos, por 
razones que además son completamente arbitrarias y ni siquiera se dejan formular con 
precisión, dudemos siquiera un instante de que la aplicación del Tertium non datur se 
justifica?” (Hilbert 1931, pp. 487s.). 

El término “epsilóntica” alude a la práctica habitual en los cursos de análisis de utilizar 
la minúscula griega epsilon (e) para referirse a una cantidad arbitrariamente pequeña. 
Por ejemplo, decimos que la función f: R = |R es continua en el argumento a si, para 
cualquier e > 0, hay un 6 > 0 tal que If(x) — f(a)l < e si lx — al < 6. 
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queño e infinitamente grande no era más que una manera de hablar, así 
también lo infinito en el sentido de la colección infinita, como aún ahora 
se nos presenta en los modos de inferencia, tiene que reconocerse como 
algo meramente aparente. Y así como el operar con lo infinitamente pe- 
queño fue reemplazado con procesos en el dominio finito que efectúan lo 
mismo y llevan a las mismas elegantes relaciones formales, así también 
en general hay que reemplazar los modos de inferencia que envuelven lo 
infinito con procesos finitos que efectúan lo mismo, es decir, que hacen 
posibles las mismas demostraciones y los mismos métodos para obtener 
fórmulas y teoremas. 

(Hilbert 1926, p. 162; cursiva mía)!? 


Otra analogía favorita de Hilbert son los “elementos ideales” introducidos 


en diversas teorías matemáticas para redondearlas o simplificarlas. 


Así como ¡ = v-1 se introdujo para mantener en pie en su forma más 
simple las leyes del álgebra —por ejemplo, las que se refieren a la exis- 
tencia y número de las raíces de una ecuación—; así como los factores 
ideales se introdujeron para preservar también entre los números enteros 
algebraicos las leyes simples de divisibilidad —y así, por ejemplo, intro- 
ducimos un divisor común de los números 2 y (1 + 1), aunque no tie- 
nen uno real —; así también tenemos que adjuntar (adjungieren) los enun- 
ciados ideales a los enunciados finitos, para preservar las reglas formales 
simples de la logica aristotélica usual. 

(Hilbert 1926, p. 174; cf. 1928 en GG”, pp. 298s.) 


El origen y la índole de tales enunciados ideales puede ilustrarse con el ejem- 
plo del álgebra y su método de cálculo literal. Consideremos una vez más el 
teorema arriba demostrado: a + b = b + a, cualesquiera que sean los núme- 
ros A y b. Aquí las letras góticas a y b son, como dijimos, signos con sig- 
nificado: cada una representa un número indeterminado cualquiera. Pero en 
la práctica ordinaria del álgebra este significado se olvida: el cálculo literal 
maneja las letras como objetos primarios que no remiten a nada más allá, 
“signos sin significado” como los signos 1 y + de la aritmética finita de 


A este mismo contexto pertenece la frase de Hilbert en que se inspira el título de este 
libro: “Del paraíso que Cantor creó para nosotros, nadie podrá expulsarnos” (1926, p. 
170). Las expresiones que destaqué en el pasaje arriba citado indican que Hilbert con- 
cibe este paraíso como un set cinematográfico: el Jardín de las Delicias pintado sobre 


papel. 
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Hilbert. Por eso Hilbert puede decir (1926, p. 175) que la fórmula algebraica 


a+b=bx+xa 


no constituye “una comunicación directa de algo sustantivo”!” sino que es 
sólo una “figura formal”, cuya relación con los enunciados finitos 


3+2=2+3 


5+7=7+5 


consiste en que éstos pueden inferirse de aquélla en virtud de los axiomas y 
reglas de inferencia comúnmente aceptados. Generalizando este enfoque, la 
matemática puede verse como una provisión de fórmulas, que en parte ex- 
presan enunciados finitos de contenido sustantivo y en parte no significan 
nada. Estas últimas son los enunciados ideales. 


20 


Como los enunciados ideales —esto es, las fórmulas que no expresan 
aseveraciones finitas— no significan nada, las operaciones lógicas no 
pueden aplicárseles de un modo sustantivo como a los enunciados finitos. 
Es necesario entonces formalizar también las operaciones lógicas y las 
demostraciones matemáticas mismas. 

(Hilbert 1926, p. 176) 


Como expliqué en la p. 123, nota 13, uso “sustantivo” para traducir el término hilbertiano 
“inhaltlich”. 

Hilbert prosigue diciendo que, gracias a esa “armonía preestablecida que tan a menudo 
se observa en la historia evolutiva de la ciencia”, dicha formalización está ya muy ade- 
lantada por obra de los creadores del cálculo lógico. 


Los símbolos del cálculo lógico se introdujeron originalmente sólo para la comu- 
nicación; pero es consecuente que ahora neguemos todo significado a los signos 
lógicos, igual que a los matemáticos, y declaremos que también las fórmulas del 
cálculo lógico no significan nada de por sí, sino que son enunciados ideales. En el 
cálculo lógico poseemos un lenguaje de signos que es capaz de abarcar en fórmu- 
las los teoremas matemáticos y de expresar la inferencia lógica mediante procesos 
formales. Igual que en el tránsito de la aritmética sustantiva (inhaltliche 
Zahlenlehre) al álgebra formal, contemplamos los signos y símbolos de operacio- 
nes del cálculo lógico prescindiendo de su significado sustantivo. Así obtenemos 
finalmente, en lugar de la ciencia matemática sustantiva que se trasmite mediante 
el lenguaje ordinario, una provisión de fórmulas con signos matemáticos y lógi- 
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Mediante la formalización de las demostraciones, los enunciados ideales 
y los enunciados finitos se entrelazan en un sistema formal de matemáticas. 
¿En qué relación quedan éstos con aquéllos dentro de dicho sistema? Para 
arrojar luz sobre esta cuestión me referiré a un famoso ejemplo de “elemen- 
tos ideales” que Hilbert menciona a veces: los “puntos infinitamente leja- 
nos” de la geometría proyectiva (cf. Hilbert 1923, p. 187; 1926, p. 166). 
Aunque la invención de este recurso puede atribuirse a Kepler y fue utiliza- 
do por Desargues y Pascal en el siglo XVIl, el auge de la geometría 
proyectiva comienza en 1822 con la publicación del Traité des propriétés 
projectives des figures de Poncelet. Sesenta años más tarde, Pasch (1882) la 
llama simplemente “geometría moderna”. El giro característico que conduce 
de la geometría tradicional a la proyectiva puede describirse sumariamente 
así: Consíderese un plano euclidiano; a cada recta le agregaremos un objeto 
que llamamos “el punto en el infinito” de esa recta. Con este agregado, ha- 
bremos formado el plano proyectivo si sobreentendemos que (i) si p es el 
punto en el infinito de una recta cualquiera A y a, b y c son tres puntos de 
A tales que b está entre a y c, entonces a está entre p y b, y c está entre b 
y p (en virtud de esto es claro que el conjunto de todos los puntos de A tiene 
el mismo tipo de orden que los puntos de un círculo); (11) el punto en el 
infinito de A es idéntico al punto en el infinito de cualquier recta paralela a 
A, de modo que todas las rectas de una familia de paralelas se intersectan en 
su respectivo punto en el infinito; (111) los puntos en el infinito pertenecien- 
tes a cada familia de paralelas forman la “recta en el infinito” del plano 
proyectivo; el orden (cíclico) de los puntos de la recta en el infinito se de- 
riva fácilmente del orden en que las rectas ordinarias que pasan por un mis- 


cos, enfiladas unas tras otras según ciertas reglas. A los axiomas matemáticos 
corresponden algunas de las fórmulas, y a la inferencia sustantiva corresponden 
las reglas de acuerdo con las cuales se suceden las fórmulas. De este modo, la 
inferencia sustantiva es reemplazada por un operar extrínseco (ein duferes Handeln) 
conforme a reglas y se consuma rigurosamente el tránsito del tratamiento ingenuo 
al tratamiento formal con respecto a los axiomas mismos —que en un principio 
se propusieron ingenuamente como verdades fundamentales, pero que la axiomática 
moderna considera hace tiempo como meras combinaciones de conceptos— y tam- 
bién con respecto al cálculo lógico, que originalmente no pretendía ser sino un 
lenguaje más. 

(1926, pp. 176s.; cf. GA III, 165, 179; GG”, pp. 298s.). 
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mo punto ordinario q intersectan un círculo cualquiera con centro en q, ya 
que cada punto de la recta en el infinito pertenece a una y sólo una de esas 
rectas ordinarias. Los puntos en el infinito han solido considerarse como meras 
ficciones, pero también se los ha identificado, por ejemplo, con la dirección 
de la recta respectiva: no cabe duda que cada recta del plano euclidiano tie- 
ne una dirección y que tal dirección es común a todas las rectas de una fa- 
milia de paralelas. La innovación de la geometría proyectiva consiste enton- 
ces en definir convencionalmente una relación de orden —descrita en (1) y 
(11) — entre los puntos de una recta y su dirección (como se define en dere- 
cho una relación legal de parentesco entre los consanguíneos de una persona 
y los consanguíneos de su cónyuge). Más satisfactorio aún es concebir a los 
elementos del plano proyectivo como objetos cualesquiera, cuyas propieda- 
des y relaciones se especifican mediante postulados, siguiendo el ejemplo de 
Hilbert (1899, 1900). Visto de este modo, el plano proyectivo resulta ser no 
una ficción matemática arbitraria, ni tampoco un monstruo quimérico gene- 
rado asimilando las direcciones de rectas a los puntos del plano, sino una 
estructura abstracta realizable en objetos familiares. Concretamente, el haz 
de todas las rectas que pasan por un punto p del espacio ordinario constitu- 
ye una realización del plano proyectivo si convenimos en llamarlas “puntos”, 
llamamos *recta” a cada plano determinado por dos de ellas, y designamos 
un plano cualquiera como “la recta en el infinito” (lo arbitrario de esta selec- 
ción refleja la circunstancia de que en la teoría del plano proyectivo no hay, 
en efecto, ninguna diferencia entre la recta en el infinito y las otras rectas). 
Si eliminamos del haz el plano elegido para desempeñar este papel, resta un 
sistema de “puntos” y “rectas” que llamaré los “elementos finitos” del plano 
proyectivo. Dicho sistema reproduce las relaciones de incidencia y orden entre 
sus homónimos en el plano euclidiano. Por lo tanto, cualquier teorema de la 
geometría proyectiva plana concerniente a relaciones de incidencia u orden 
entre elementos finitos expresa una verdad de la geometría euclidiana plana. 

Aplicando la analogía de la geometría proyectiva al sistema de la mate- 
mática formal concluimos que dentro de éste los enunciados finitos no se 
distinguen de los enunciados ideales: unos y otros están a la par. Por lo tan- 
to, desde un punto de vista inmanente al sistema, aquéllos no tienen ni una 
brizna más de significado que éstos. La diferencia, extrínseca al sistema for- 
mal, viene de que los enunciados finitos tienen —y los ideales no— una 
traducción dotada de sentido al lenguaje informal e intuitivo de la práctica 
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matemática ordinaria y de la experiencia. La utilidad de los enunciados ideales 
reside esencialmente en esto: en el sistema enriquecido con ellos es más fácil 
validar muchos enunciados finitos cuya traducción dotada de sentido es ver- 
dadera. Como es obvio, tal utilidad se perdería si el sistema formal permitie- 
ra validar algún enunciado finito cuya traducción fuese falsa. En otras pala- 
bras: para ser útil, el sistema de la matemática formal debe constituir una 
extensión conservadora del sistema de los enunciados finitos. Evidentemen- 
te, esto es así sólo si la matemática formal es consistente, esto es, si no todo 
enunciado formulable en el sistema es a la vez validable en el sistema. In- 
troduciendo más precisión en el planteamiento del problema se puede probar 
que esta condición necesaria también es suficiente, esto es, que si el sistema 
formal es consistente todo enunciado finito validable en él es verdadero 
(Smorynski 1977, pp. 846-47; cf. pp. 823-24). La matemática clásica queda- 
rá, pues, vindicada si se establece la consistencia de su versión formalizada. 
Con este fin, Hilbert hace del sistema mismo de la matemática formal un 
objeto de investigación matemática en el sentido tradicional. La investiga- 
ción puede conducirse sin infringir las limitaciones impuestas a la matemá- 
tica sustantiva, ya que los enunciados del sistema formal son secuencias fi- 
nitas de signos tomados de un alfabeto finito y las derivaciones que validan 
un enunciado dado a partir de otros ya validados son secuencias finitas de 
enunciados, y ambos géneros de secuencias obedecen a reglas perspicuas. 
Hilbert llama “metamatemática” (Metamathematik) o también “teoría de la 
prueba” (Beweistheorie) a la disciplina matemática —una especie de análisis 
combinatorio— encargada de tal investigación. Ella constituye un discurso 
con sentido, un razonar sustantivo acerca de los objetos finitos —signos, 
fórmulas, pruebas— que componen la matemática formalizada. Se trata, en 
suma, de mostrar que un enunciado cualquiera, por ejemplo *1 % 1”, no se 
puede validar derivándolo en el sistema formal. ¿Quién podría dudar de que 
esta tarea es abordable de un modo puramente intuitivo? Hilbert la compara 
con la demostración, conocida desde la antigiiedad, de que 2 es irracional. 
Para establecerlo demostramos intuitivamente que no puede haber dos nú- 
meros a y b tales que a?= 26?, o sea, que no pueden existir dos numerales 
constituidos del modo descrito.?! “Análogamente, nos corresponde mostrar 


a La demostración, trasmitida en uno de los apéndices apócrifos de los Elementos de 


Euclides, puede formularse así: Si Y2 no es irracional, hay dos números a y b, primos 
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que no puede haber una prueba constituida de cierto modo. Pero una prueba 
formalizada, lo mismo que un numeral, es un objeto concreto y abarcable 
con la mirada. Es comunicable de principio a fin. También la requerida cons- 
titución de la fórmula final, a saber, que lea *1 + 1”, es una propiedad con- 
cretamente constatable de la prueba. Por lo tanto, esta demostración de he- 
cho puede suministrarse, y con ella ganamos el derecho a introducir nues- 
tros enunciados ideales” (1926, p. 179; cf. 1928, en GG”, p. 300).2 


2.9.4 La investigación de la consistencia de la matemática formalizada, 
a la luz del descubrimiento de Gódel 


El programa de Hilbert propone, pues, probar la consistencia del sistema 
formal de la matemática clásica con medios finitos razonando sustantivamente 
sobre sus enunciados y derivaciones, considerados como combinaciones de 
signos sin sentido. Esta empresa, al parecer tan factible, ha sido puesta en 
cuestión en vista de los resultados que Gódel anunció a fines de 1930 y 
demostró rigurosamente en su artículo de 1931, que examinaremos en deta- 
lle en el Capítulo 2.10. Me parece oportuno explicar aquí sumariamente en 
qué sentido preciso el programa de Hilbert queda afectado por dichos resul- 
tados. Así podré afinar un poco más mi descripción de este programa y tam- 


entre sí, tales que a/b = 2. En tal caso, 02= 2b?, Por lo tanto, a? es un número par. 
Pero un número par no puede ser el cuadrado de un número impar (si Y = 2n + 1, 
entonces 1?= 41? + 2n + 1, que es impar). Por lo tanto, a es par: a = 2c. Por lo tanto, 
2b? = a? = 4c? y b? = 2c?. Por lo tanto, también b es par. Por lo tanto, a y D no son 
primos entre sí. ¡Contradicción! Por lo tanto, 2 es irracional. 

El optimismo de Hilbert sería más justificado si la matemática formalizada fuese in- 
consistente y se tratase de mostrarlo mediante razonamientos sustantivos sobre objetos 
finitos. Para eso sí que nos ayudaría la índole “concretamente constatable” de la fór- 
mula “1 + 1”. Bastaría construir una prueba formal que desemboque en esta fórmula. 
Pero la tarea de la metamatemática hilbertiana consiste en mostrar mediante tales razo- 
namientos que la fórmula “1 4 1” no puede aparecer nunca en la última línea de una 
prueba de la matemática formalizada; y no veo bien por qué Hilbert daba tan fácilmen- 
te por descontado que esta aseveración referente a todas las infinitas pruebas en prin- 
cipio enunciables podría demostrarse con medios finitos. 
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bién, espero, motivar al lector para el esfuerzo de atención que requiere el 
estudio de la obra de Gódel. 

Gódel considera una formalización de la aritmética elemental ajustada al 
prototipo de Principia Mathematica “y sistemas afines”. Las investigaciones 
de Church, Turing y otros (Capítulo 2.11) han permitido determinar con pre- 
cisión los requisitos que tiene que cumplir un sistema formal para que se le 
apliquen los resultados de Gúdel y sea, en este sentido, afín a Principia 
Mathematica. Se trata sencillamente de esto: que existan procedimientos de 
cómputo para decidir, en un número finito de operaciones, si un objeto dado 
es o no un signo del sistema, si una secuencia de tales signos es o no un 
enunciado del sistema y si una secuencia de tales enunciados es o no una 
derivación —una “prueba”— del sistema. No me cabe ninguna duda de que 
los sistemas formales estudiados en detalle en la década de los 20 por los 
seguidores de Hilbert — Ackermann, Herbrand, von Neumann— llenaban los 
requisitos indicados. Por otra parte, en un escrito aparecido el mismo año 
que el artículo de Gódel, Hilbert propone adoptar en la matemática formali- 
zada una regla de inferencia que infringe esos requisitos, por cuanto autoriza 
derivaciones con una lista infinita de premisas. La referida regla dice así: 


Si se ha comprobado que la fórmula %(3) —donde 3 es un numeral 
dado— es siempre [esto es, para cualquier numeral —R.T.] una fór- 
mula numérica correcta, puede usarse como premisa la fórmula 
VA (0.4 


Hilbert agrega que la nueva regla de inferencia es “finita”, lo que indica — 
me parece— que entendía esta palabra clave en una acepción muy personal. 
Los sistemas formales que Hilbert y Bernays estudian en el magnum opus 
publicado en 1934 y 1939 no incluyen esta regla, y son todos afines a Prin- 
cipia Mathematica en el sentido explicado. Ello no obstante, no debemos 
perder de vista que Hilbert, aún antes de estudiar los resultados de Gódel, 
estaba dispuesto a favorecer un método de formalización que los evade. 


57 Hilbert 1931, p. 491. La regla citada suele llamarse “la regla w” (cf. Isaacson 1992). 


Hilbert comenta que la “oración (Aussage)” Vx%(x) va mucho más lejos que la “fór- 
mula (Formel)” YA(3), con 3 un numeral cualquiera, puesto que aquélla autoriza a infe- 
rir toda oración que se obtenga reemplazando en %(x) la variable libre x por cualquier 
término que denote un número (no sólo por cualquier numeral). 
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Sea un sistema formal de aritmética del género descrito. Como luego 
veremos, Gódel ideó un método para representar mediante números los sig- 
nos, enunciados y derivaciones de Y. Las propiedades y relaciones sintácticas 
de dichos objetos de F vienen a quedar representadas por propiedades y re- 
laciones aritméticas de los números correspondientes. La investigación 
metamatemática de con medios finitos se refleja entonces exactamente en 
una investigación combinatoria sobre dichos números, sus propiedades y 
relaciones, cuyos razonamientos y resultados se dejan por cierto formalizar 
en . En particular, puede definirse un predicado aritmético P atribuible a 
un número si y sólo si ese número representa una fórmula derivable en 4. 
Entonces, si a es el número representativo de la fórmula de $ que expresa el 
enunciado *1 + 1”, el enunciado que atribuye el predicado P al número a es 
verdadero si y sólo si $ es inconsistente y la negación de este enunciado es 
verdadera si y sólo si es consistente. Y habrá muchos otros enunciados 
que, como éste, representan la consistencia de . Como son enunciados arit- 
méticos, cada uno de ellos se expresa formalmente mediante una fórmula de 
$. Sea *Consis $” la fórmula correspondiente a cualquiera de ellos. Gódel 
demostró que Consis $ no puede derivarse en $ a menos que F sea incon- 
sistente. Este es el resultado que, en opinión de la mayoría de los matemá- 
ticos, dio un golpe de muerte al programa de Hilbert.2* A la luz de las expli- 
caciones precedentes, no cabe duda de que este diagnóstico es acertado si la 
investigación metamatemática se deja representar, como se ha dicho, por una 


2% El pasaje siguiente expresa la opinión del grupo Bourbaki: 


Es en efecto en lo relativo a la cuestión de la no-contradicción de las teorías mate- 
máticas —el origen y el corazón mismo de la metamatemática— que los resulta- 
dos se han revelado más defraudantes. Durante los años 1920-1930 Hilbert y su 
escuela desarrollaron métodos nuevos para abordar estos problemas; tras haber 
demostrado la no-contradicción de formalismos parciales, que cubrían una parte 
de la aritmética, creían estar a un paso de la meta y demostrar no sólo la no- 
contradicción de la aritmética sino también la de la teoría de conjuntos, cuando 
Gódel, apoyándose en la no-categoricidad de la aritmética, dedujo la imposibili- 
dad de demostrar mediante los “procedimientos finitos” de Hilbert, la no-contra- 
dicción de cualquier teoria Y que contenga a la aritmética. 

Sin embargo, el teorema de Gódel no cierra totalmente la puerta a las tenta- 
tivas de demostrar la no-contradicción, con tal que se abandonen (al menos par- 
cialmente) las restricciones de Hilbert concernientes a los “procedimientos fini- 
tos”. Es así como Gentzen en 1936 logró demostrar la no-contradicción de la arit- 
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investigación aritmética formalizable en ; pero el diagnóstico no tiene base 
si la investigación metamatemática dispone de recursos que no pueden re- 
presentarse así. Ahora bien, parecería que los recursos y procedimientos 
representables en la aritmética elemental y, por ende, en abarcan todo lo 
que una persona sensata pudiera describir como “métodos finitos”. Por otra 
parte, como veremos en el Capítulo 2.12, Gerhard Gentzen (1935, 1938) 
demostró la consistencia de un sistema formal de aritmética del tipo estudia- 
do por Gódel empleando inducción transfinita hasta el ordinal numerable que 
Cantor llamó e, (el primer ordinal E, tal que w% = £.). Hilbert y Bernays 
reconocieron que los métodos de Gentzen tenían cabida dentro del programa 
de Hilbert y eran compatibles con su punto de vista finitista. Para ello tuvie- 
ron que “ampliar el marco de los modos de inferencia sustantivos admitidos 
en la teoría de la prueba” (1939, p. vii; cito el original en la p. 421, nota 1), 
pero esto no les causó, al parecer, ningún escrúpulo. Resta, sin embargo, una 
duda: si el programa de Hilbert acaba recurriendo al transfinito, ¿por qué 
tantos melindres y reservas ante el paraíso heredado de Cantor? ¿por qué no 
instalarse en él, alegremente, de una vez por todas? 


mética formalizada utilizando “intuitivamente” la inducción transfinita hasta el 
ordinal numerable e. El valor de “certeza” atribuible a tal razonamiento es sin 
duda menos probatorio que en el caso de los que satisfacen a las exigencias ini- 
ciales de Hilbert y es esencialmente cosa de la psicología personal de cada mate- 
mático. 

(Bourbaki 1970, E.IV.75-76) 


Últimamente algunos filósofos han alegado que el citado descubrimiento de Gódel no 
constituye un obstáculo para el programa de Hilbert (Webb 1980, Detlefsen 1986, 1990). 
Pero hasta la fecha no han establecido que la consistencia de la aritmética se pueda 
demostrar con recursos más débiles que los utilizados por Gentzen. Me referiré nueva- 
mente a Detlefsen una vez que hayamos estudiado los resultados de Gúdel (p. 358, 
nota 48). 


2.10 LOS TEOREMAS DE INCOMPLETUD DE GÓDEL 


2.10.1 Preliminares 


En este capítulo estudiaremos el escrito de Gódel “Sobre proposiciones 
formalmente indecidibles de Principia Mathematica y sistemas afines” (1931). 
Su enorme resonancia histórica responde, en parte, a sus sorprendentes re- 
sultados, pero también a los métodos de que el autor se vale para establecer- 
los. Los métodos de Gódel sientan las bases para una nueva disciplina ma- 
temática, la teoría de las funciones recursivas o “computables”. El gran im- 
pacto de esta disciplina sobre la vida diaria viene de que ella es el núcleo 
teórico en torno al cual se desarrolla, en la segunda mitad del siglo XX, la 
llamada “informática” y la industria de las computadoras. Mas desde un punto 
de vista estrictamente científico y filosófico su significación radica en que 
hay buenas razones para pensar que el concepto preciso de función compu- 
table, definido de varias maneras equivalentes por sus cultivadores, abarca 
todas las funciones numéricas (con argumentos y valores en N) cuyo valor, 
para cada argumento dado, puede calcularse mediante un algoritmo, en el 
sentido intuitivo corriente.! En el Capítulo 2.7 (p. 247), apelé a la idea 
intuitiva de algoritmo para caracterizar los sistemas formales o “cálculos” a 
que Hilbert y su escuela querían reducir la matemática clásica. Si esa idea 
intuitiva —y vaga— se reemplaza con el concepto preciso que es el tema de 
la referida disciplina, los resultados obtenidos por Gódel limitan de un modo 
claro y terminante el alcance de cualquier representación de teorías matemá- 
ticas mediante tales cálculos y la utilidad de los mismos para la fundamen- 
tación de las matemáticas. 


Como bien señala Post, “si la función recursiva general [una de esas nociones precisas 
de función computable —R.T.] es el equivalente formal de la calculabilidad efectiva, su 
formulación podría tener en la historia de la matemática combinatoria una importancia 
superada sólo por la formulación del concepto de número natural” (1944, p. 315). 
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Gódel concentra su atención en cierto cálculo P, que se parece mucho al 
utilizado en Principia Mathematica.? Pero sus razonamientos se basan sólo 
en ciertas características muy generales de P, y sus conclusiones valen, por 
ende, para todo cálculo que las comparta. Desde luego, es claro que tanto el 
cálculo de Principia Mathematica como los utilizados por Ackermann, von 
Neumann y Herbrand en sus investigaciones metamatemáticas se hallan en 
ese Caso, y que costaría muy poco adaptar la argumentación de Gódel a 
cualquiera de ellos.? Mas para enunciar los teoremas de Góúdel con toda 
generalidad, habría que decir exactamente en qué consisten las característi- 
cas en cuestión. Así se deslindaría la clase de los “sistemas afines” a Prin- 
cipia Mathematica mencionados el título de Gódel 1931. Ahora bien, dichas 
características se reducen esencialmente a dos: (i) cada cálculo o sistema de 
esa clase provee una representación formal de la aritmética elemental; y (11) 
la sintaxis del cálculo puede a su vez representarse mediante números natu- 
rales y sus propiedades y relaciones. Luego explicaré en detalle el significa- 
do de (i) y (ii) a propósito del cálculo P de Gódel.* En todo caso, la idea de 
una representación formal de la aritmética no tomará por sorpresa al lector 
de los capítulos anteriores (especialmente, el 2.6). En cambio, la idea de una 
representación numérica de la sintaxis del cálculo es una de las contribucio- 
nes originales de Gódel, de una sencillez genial. Como veremos luego, la 
representación numérica requerida debe cumplir con los siguientes requisi- 
tos: (a) que cada objeto del cálculo, esto es, cada signo, cada fila de signos 
y cada lista de tales filas de signos, tenga un número de identidad exclusivo; 
(b) que, dado un número natural n, sea posible establecer, mediante un nú- 
mero finito de operaciones aritméticas elementales, si n es o no el número 


En la comunicación preliminar de sus resultados a la Academia de Viena, Gódel (1930b) 
dice haberlos establecido para el caso del cálculo de Principia Mathematica “con Axioma 
de Reducibilidad o sin Teoría Ramificada de los Tipos” (CW, L, 140 n.1). De hecho, su 
cálculo P se ajusta a la segunda alternativa: es un cálculo predicativo de orden (w, con- 
forme a la teoría simple de los tipos. 


En cambio, como indiqué en la p. 317, la argumentación de Gódel no es aplicable a un 
cálculo cuyas reglas de inferencia incluyan la regla o, allí citada, que Hilbert (1931, p. 
491) propuso después que le comunicaron los resultados de Gódel. 


El Apéndice XVI contiene una formulación precisa de las condiciones (1) y (11), aplica- 
ble a cualquier cálculo. Ella proviene de una obra reciente (Smullyan 1992), donde se 
la utiliza en la presentación de la “forma abstracta” del primer teorema de incompletud 
de Gódel resumida en dicho Apéndice. 
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de identidad de una prueba (esto es, de una lista de fórmulas del cálculo, 
cada una de las cuales es un axioma del cálculo o se deduce, conforme a las 
reglas de inferencia del cálculo, de una o más fórmulas que la preceden en 
la lista) y, en caso afirmativo, (c) que sea posible reconstruir las fórmulas de 
que consta la prueba correspondiente. Gracias a esta doble representación — 
de la aritmética en el cálculo y del cálculo en la aritmética— Gódel puede 
cerrar el círculo de espejos en que descansa su Teorema VI, el “primer teo- 
rema de incompletud”. En la Sección 2.10.2 describiré, paso a paso, la com- 
pleja argumentación que culmina en ese teorema. Pero antes conviene deli- 
nearla a grandes rasgos, para saber adónde lleva, y sobre todo para captar 
con un sólo golpe de vista la función que desempeñan en ella las caracterís- 
ticas (1) y (11). El bosquejo siguiente es una paráfrasis del ofrecido por el 
mismo Gódel (1931, $ 1). 

Gódel supone que toda oración deducible de los axiomas del cálculo con- 
siderado —esto es, toda oración que ocupa el último lugar de una lista que 
constituye una prueba— expresa una aseveración verdadera. Este supuesto 
es muy razonable, pues mal podría pretenderse formalizar la aritmética en 
un cálculo que genera teoremas falsos. Con todo, Gódel lo adopta sólo para 
facilitar la presentación del bosquejo preliminar: la demostración rigurosa del 
Teorema VI en el $ 2 depende de supuestos puramente sintácticos, y no in- 
voca el concepto de verdad. Para decir en castellano que q es una oración 
deducible de los axiomas del cálculo, escribiremos Hp;? asimismo, la abre- 
viatura XQ expresará que q no es una oración deducible de los axiomas del 
cálculo. Supondremos que el cálculo contiene categorías sintácticas homólogas 
a las constantes y variables de nuestros cálculos predicativos (Apéndice IX).* 
Para que pueda representar formalmente la aritmética, el cálculo debe conte- 
ner un conectivo —primitivo o introducido por definición— que prefijado a 
una oración verdadera genere una oración falsa y prefijado a una falsa gene- 
re una verdadera. Simbolizaré este conectivo del cálculo con el signo 


Gódel usa la abreviatura Bew, del alemán “beweisbar” (*demostrable”). Sus traductores 
al inglés y al castellano han preservado esta abreviatura, aunque en estos idiomas, a 
diferencia del original, ella obstaculiza la lectura: no sólo no evoca ninguna palabra 
pertinente, sino que ni siquiera se la puede pronunciar con facilidad. 

Este requisito afecta, sin duda, la generalidad del argumento. Como puede verse en el 
Apéndice XVI, de hecho no se lo necesita para demostrar la “forma abstracta” del pri- 
mer teorema de Gódel presentada allí. 
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russelliano de negación —.” Diré que la oración y es demostrable si es de- 
ducible de los axiomas, esto es, si HQ; y que es refutable si su negación es 
demostrable, esto es, si F-Q. Se trata de probar que hay en el cálculo por lo 
menos una oración que no es demostrable ni refutable. 

Sea %, la clase de las fórmulas que contienen una y sólo una variable 
libre. Si a es una fórmula de esa clase, designamos con [o.;n] a la fórmula 
—en efecto, una oración — obtenida al sustituir la única variable libre de a 
(en todas sus posiciones) por el nombre del número n. Suponemos **, orde- 
nada según el orden de magnitud creciente de los números de identidad de 
sus fórmulas. Sea R,, la n-ésima fórmula de %, y K el conjunto de todos los 
números n tales que X[R,;n].* Pertenecer a K es una propiedad de números 
que se puede representar en el cálculo, si éste posee la característica (1). Tiene 
que haber, pues, una fórmula k de la clase %, que se transforma en una 
oración verdadera cuando su única variable libre es reemplazada por el nom- 
bre de un número que pertenece a K y en una oración falsa cuando esa va- 
riable es reemplazada por el nombre de un número que no pertenece a K. 
Esa fórmula tiene un número de identidad, digamos, el g-ésimo en el orden 
inducido en %,. La fórmula k es, entonces, precisamente la fórmula que 
hemos convenido en llamar Ro Consideremos la oración [R,;q). Esta ora- 
ción no es demostrable ni refutable en el cálculo. En efecto, supongamos 
que F[R,:q]. Entonces [R,;q] es verdadera. Pero [R,:q] es la oración obteni- 
da al reemplazar la variable libre en R, por el nombre del número q. Dicha 
oración es verdadera sí y sólo si q e K, esto es, si y sólo si X[R,:ql. Por lo 
tanto, [R,:q] no es demostrable. Supongamos, entonces, que su negación lo 
es, esto es, que Er=[R,:gl. Entonces [R,;q) es falsa. Pero [R,;q) es la oración 
obtenida al reemplazar la variable libre en R, por el nombre del número q; 
dicha oración es falsa sí y sólo si q £ K, esto es, si y sólo si F[R,:g. Así 
pues, [R.;q] sólo es demostrable si también lo es [R ¿9l, o sea, si el cálcu- 
lo es inconsistente. Pero esto sería incompatible con el supuesto inicial de 


Adopto esta convención porque en toda este capítulo utilizaré nuestros símbolos logicos 
como abreviaturas del discurso metalógico que conducimos en castellano. Imito así la 
práctica de Gódel, que destinó a tal propósito los símbolos de Hilbert y Ackermann 
1928. 

En otras palabras, el número n pertenece al conjunto K si y sólo si la oración obtenida 
al sustituir la variable libre en la fórmula R,, por el nombre de n no es deducible de los 
axiomas de P. 
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que ninguna oración falsa es deducible de los axiomas. 

El argumento precedente muestra que un cálculo que posee las caracterís- 
ticas (1) y (11) y en que toda expresión demostrable es verdadera contiene 
necesariamente una oración que no es demostrable ni refutable. En otras 
palabras, cualquier cálculo de la clase indicada es incompleto en el sentido 
de Post. La oración [R,;q], que lo atestigua, es verdadera si y sólo si el 
número q pertenece al conjunto numérico 


K = (n:[R,¿n] no es deducible de los axiomas). 
Tenemos, entonces, que [R 9) es verdadera, puesto que [R,;gl, en efecto, no 
es demostrable. Por otra parte, como [R,;q] no es demostrable, si agregamos 
a la lista de axiomas la oración falsa —[R,;ql, el sistema así formado es 
consistente. Por lo tanto, la verdad matemática no puede simplemente equi- 
pararse a la deducibilidad en un sistema consistente, como pretendía Hilbert.? 
El razonamiento de Gódel ilustra el “método diagonal” descrito en la p. 
43, nota 11. Como se recordará, dicho método se utiliza asimismo en la 
demostración del Teorema de Cantor y en la construcción de la paradoja de 
Russell. Gódel subraya la analogía entre su razonamiento y las paradojas de 
Richard y del mentiroso. Pero también la diferencia es obvia: “la fórmula q 
es verdadera si y sólo si la negación de (p es verdadera” es una contradic- 
ción; pero “la fórmula q es demostrable si y sólo si la negación de p es 
demostrable” significa únicamente que la fórmula q no puede deducirse de 
los axiomas convenidos aplicando las reglas de inferencia adoptadas (a me- 
nos que esos axiomas y reglas determinen un sistema deductivo inconsisten- 
te). Aunque defraudante para quien haya puesto su fe en los poderes del cál- 
culo, esta conclusión no tiene nada de paradójica. De hecho, no debiera sor- 
prendernos, puesto que, como se ha visto en los capítulos anteriores, el uso 
de cálculos lógicos implica un sacrificio feroz de la inteligencia en aras de 
la seguridad. 


id Recuérdese el pasaje de la carta de Hilbert a Frege del 29 de diciembre de 1899 (Frege, 
KS, p. 411), citado en p. 118. 
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2.10.2 La incompletud de la aritmética 


Concluido el bosquejo preliminar, Gódel emprende una demostración ri- 
gurosa de sus resultados, aplicable a cierto cálculo P bajo hipótesis sintácticas 
precisas relativas a su consistencia. El $ 2 (1931, pp. 176-191), que conclu- 
ye con el primer “teorema de incompletud” (Teorema VI), es una de las 
cumbres de la historia de la lógica, y creo que el lector debe darse el trabajo 
de leerlo. (Hay una buena traducción castellana en Gódel, OC). La explica- 
ción siguiente debiera facilitar, mas no sustituir esa lectura. Omitiré, pues, 
algunos detalles. Distinguiré cuidadosamente los pasos sucesivos del razona- 
miento, señalando la función de cada uno; pero descifraré, a modo de ejem- 
plo, sólo una parte de las definiciones abreviadas de Gódel, dejando al lec- 
tor la tarea, tediosa pero necesaria, de explicitar todas las otras. 


1? El primer paso es la descripción de la sintaxis del cálculo P. En aras de 
la precisión, la repetiré íntegra; pero conviene tener presente que Gódel no 
emplea el cálculo para derivar teoremas. Por lo tanto, el lector no necesita 
dominarlo. P es un cálculo predicativo análogo a los CP= del Apéndice IX, 
pero ajustado a la teoría simple de los tipos (cf. Capítulo 2.4). Los signos 
primitivos son los conectivos — y w (negación y disyunción),'” el signo de 
cuantificación universal II, la constante individual O (“cero”), el functor unario 
f Cel siguiente de”), los paréntesis ) y (, e infinitas variables de distintos 
tipos, uno para cada entero positivo. Las variables de tipo l, Xi, Yi, Zi,...> 
representan números naturales indeterminados; las de tipo 2, X», Ya, Za, ++.» 
representan clases de números naturales; las de fipo 3, xz, yz, Zz, . . . , clases 
de clases de números naturales, etc. Gódel observa que no hace falta admitir 
variables que representen relaciones, ya que éstas pueden concebirse como 
clases de clases (por ejemplo, cada relación diádica corresponde a una clase 
de pares ordenados y cada par ordenado (x,y) a la clase de clases (xP, (x,y+)). 
Son signos de tipo 1 (1) el O, (11) cualquier variable de tipo 1, (111) cualquier 
signo de tipo 1 precedido por el functor f. Un signo de tipo 1 que contiene 
el O —por ejemplo, ffff0— se llama numeral.!! Usaré a veces la abrevia- 


Le doy al signo de disyunción vw del cálculo P más peso que Gódel para distinguirlo 
de nuestro signo v, que, como dije en la nota 7, reservo para el discurso metalógico. 


Gódel dice “Zahlzeichen”, literalmente “signo de número”. 
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tura f'0 para referirme al numeral formado por k copias de f seguidas de 0. 
Dicho numeral puede verse como el nombre, en P, del número natural k. Si 
n 2 2, un signo de tipo n es simplemente una variable de tipo n. Si a es un 
signo de tipo n (n > 2) y b es un signo de tipo n—1, la expresión a(b) es una 
fórmula elemental. Una fórmula de P es una fila de símbolos que cae bajo 
una de las descripciones siguientes: 


(1) Una fórmula elemental es una fórmula. 

(Q) Si a es una fórmula, —(a) es una fórmula (la negación de a). 

(3) Si a y b son fórmulas, (a) w (b) es una fórmula (la disyunción de 
a y b). 

(4) Si a es una fórmula y x es una variable de cualquier tipo, xII(a) es 


una fórmula (una generalización de la fórmula a); (a) es el alcance 
del cuantificador xIl; decimos que la variable x está ligada por el 
cuantificador xII en todas las posiciones que ocupa en la expresión 


(a). 


Se advertirá que hay pequeñas diferencias entre P y nuestros CP, en cuanto 
al uso de los paréntesis y la posición relativa del signo de cuantificación y 
la variable correspondiente. Como aquí estudiaremos, pero no utilizaremos 
el cálculo P, me ha parecido innecesario ajustarlo a la forma acostumbrada. 
Una variable que no está ligada se dice libre. Una fórmula sin variables li- 
bres es una oración.'? 

El cálculo P se organiza como sistema deductivo con infinitos axiomas y 
dos reglas de inferencia. Las reglas son (1) modus ponens y (11) generaliza- 
ción universal. Gódel las enuncia así: decimos que (1) la fórmula c es una 
consecuencia inmediata de las fórmulas a y b si a es la fórmula —(b) v (c) 
y (11) c es una consecuencia inmediata de a si c es la fórmula vII(a), donde 
v es una variable cualquiera. Para facilitar el enunciado de los axiomas, Gódel 
adopta “las convenciones habituales sobre la omisión de paréntesis” e intro- 
duce símbolos auxiliares, utilizados como abreviaturas (en P): los conectivos 
- (conjunción), > (implicación) y = (equivalencia) y el cuantificador 
existencial (Ex) —que supone definidos en la forma habitual (cf. Apéndice 
IX.D)— y el signo de identidad = , que define (en la nota 21) así: “x, = y,' 


12 Gódel dice “Satzformel”, literalmente “fórmula de oración”. 
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, pd 
abrevia a “x,,,¡Il(—x,,¡(%,) Y x,,10,)). Los axiomas se clasifican en cinco 
grupos. Los tres axiomas del grupo I se enuncian así: 


1.1 (fx, = 0) 
1.2 fx, = fx,>x, =X) 
13 xXx (0) x 1%) D xx) > x,11(%,(x,)) 


Estos axiomas expresan que cero no es el siguiente de ningún número, que 
el siguiente de un número no es igual al siguiente de ningún otro número y 
que si cero pertenece a una clase que contiene el siguiente de cualquier 
número contenido en ella, esa clase contiene todos los números. Correspon- 
den, pues, respectivamente, a los axiomas P4, P3 y P5 de Peano (p. 146).!* 
Los restantes axiomas se enuncian mediante esquemas, esto es, reglas para 
construir determinadas fórmulas de P, que serán propiamente los axiomas. 
Los axiomas formados según los cuatro esquemas del grupo II garantizan la 
deducibilidad de cualquier tautología (por modus ponens). El grupo III com- 
prende todos los axiomas formados reemplazando, en los dos esquemas si- 
guientes, (1) a por una fórmula cualquiera aL, (2) v por una variable cual- 
quiera £, (3) b por una fórmula en la que la que £ no esté libre en ninguna 
posición y (4) c por un signo del mismo tipo que £, y que no contenga nin- 
guna variable ligada en a. por un cuantificador dentro de cuyo alcance figure 
€. Los esquemas son: 


100 el viT(a) > ale/v] 
111.2 vII(b v a) > b v vll(a) 


Los axiomas del grupo IV desempeñan la función del Axioma de Redu- 
cibilidad de Russell y Whitehead, o de los axiomas de comprensión en la 
teoría de conjuntos. Se obtienen reemplazando en el siguiente esquema (1) v 
por una variable de tipo n > 1; (2) u por una variable de tipo n+1 y (3) a 
por una fórmula en que la variable que reemplaza a u no ocupa una posición 
libre: 


IV. 1 (EnOll(u(v) = a) 


13 Por su parte, la definición recursiva de numeral —0 es un numeral; si y es un nume- 


ral, fn es un numeral— reemplaza los axiomas P1 y P2. 
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Por último, el grupo V consta del axioma enunciado a continuación y todas 
las fórmulas que pueden obtenerse a partir de él mediante el procedimiento 
que Gódel llama “elevación de tipo”. 


v.1 x HG) = y (41) > x= Y 


Elevar el tipo de una fórmula dada a consiste, simplemente, en reemplazar 
las variables E, ..., 6y, de tipos f;,...., t,, contenidas en aL, por variables 
de E, ..., Ej de tipos f,+n,..., tn (n 2 1). 


2” El paso siguiente consiste en asignarle un número de identidad exclusivo 
a cada signo, fila de signos y lista de filas de signos de P. Si q es uno de 
estos objetos, llamaré el gódel de p (abreviado, ++[p]) al número asignado a 
en virtud del procedimiento que describiré enseguida.!'* Doy por sabida la 
siguiente propiedad de los números naturales: todo número mayor que 1 se 
puede analizar de una y sólo una manera como producto de factores primos; 
por ejemplo, 766.360 = 23 x 5! x 72x 17! x 23!. La expresión a la derecha 
del signo = es la factorización prima de 766.360 y los números 2, 5, 7, 17 
y 23 son sus factores primos. En lo sucesivo, llamaré p, al n-ésimo número 
primo (p, = 2, p, = 3, p3 =5,...). 

Siguiendo a Gódel, estipulamos que +[0] = 1, 4[f£] = 3, *[-] = 5, lv] = 
7, 401] = 9, *[0Q = 11 y 4D] = 13. Asimismo, asignamos el n-ésimo primo 
mayor que 13 —esto es, p,,¿— a la n-ésima variable de tipo 1. Si v/" desig- 
na la n-ésima variable de tipo £, 4[v,"] = (p,,,¿)' (el n-ésimo primo mayor que 
13 elevado a la t-ésima potencia). Hemos fijado así el gódel de cada signo 
de P de tal modo que dado un número cualquiera q se puede determinar 
mediante un número finito de operaciones aritméticas simples si q es el gódel 
de un signo de P: tiene que ser un impar menor que 14 o una potencia de un 


La denominación estándar de *[q] es “el número de Gódel de q”. Esta expresión tradu- 
ce literalmente las que se usan en alemán y en inglés, idiomas en que el genitivo “de 
Gódel” se expresa anteponiendo “Gódel” a “Zahl” o “'number” ('número”); pero suena 
torpe en castellano. En cambio, no me caería mal escribir, casi fonéticamente, “guédel” 
(plural, “guédeles”); pero no me he atrevido a tanto. Por cierto, la denominación “el 
gódel de q” y el símbolo +H[p] se aplican también a los números de identidad asignados 
a los objetos de cualquier cálculo lógico mediante un procedimiento análogo al que se 
explicará arriba. En el Apéndice XVII, explico el método mucho más simple propuesto 
por Smullyan (1992) para un cálculo similar a P. 
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primo mayor que 13; además, al averiguarlo, se establece a qué signo co- 
rresponde. Supongamos ahora que D = Q.,0, ... 0, es una fila de k signos 
de P. Estipulamos que +[0] = 2*%11x 3H%21x... x pH, Por último, si £ 
=(D,,0D,,..., D,) es una lista de filas de signos de P, estipulamos que +[£] 
= 201 x HPA... x pH Nuestras estipulaciones garantizan la unici- 
dad del gódel correspondiente a cada fila de signos y a cada lista de filas, 
así como la posibilidad de recuperar el objeto correspondiente a un número 
dado con sólo analizarlo en sus factores primos.!* Por lo tanto, si n es el 
gódel de un objeto del cálculo, el objeto con gódel n es un ente perfecta- 
mente determinado, que llamaré j[n]. Por otra parte, es claro que, bajo las 
condiciones prescritas, hay números que no son el gódel de ningún objeto 
del cálculo P. 

Sea K una propiedad atribuible a ciertos objetos del cálculo; por ejemplo, 
la propiedad de ser una variable de tipo 5, o de ser una prueba, o de ser una 
fórmula no demostrable. Entonces, la clase de números K* = (x:x es el gódel 
de un objeto que tiene la propiedad K) provee una representación numérica 
de la propiedad K. Es natural referirse a los elementos de K* con un predi- 
cado que recuerde al utilizado para designar la propiedad K. Gúdel (1931) 
usa con este fin el mismo predicado, impreso en cursivas. Pero aquí, siguiendo 
la práctica de sus editores (CW, OC), usaré las versalitas. Así, si aL es un 
axioma de P, digo que el número *[o.] es un axIoMa. En otras palabras, el 
número x es un AXIOMA si y sólo si el objeto +[x] existe y es un axioma de 
P. Lo mismo vale, mutatis mutandis, para las relaciones. Por ejemplo si la 
fórmula a. es una consecuencia inmediata por modus ponens de las fórmulas 
B y y, digo que +f[o.] es una CONSECUENCIA INMEDIATA POR MODUS PONENS de 


%[B1 y *lyl. 


3” Enseguida, Gódel define lo que llama funciones y relaciones recursivas. 
Aunque lo presenta como “una digresión (eine Zwischenbetrachtung) que, 
por de pronto, no tiene nada que ver con el sistema formal P” (1931. p. 179), 
este pasaje —como arriba adelanté— ha tenido repercusiones enormes. Lo 


Obsérvese, por ejemplo, que un número dado es el gódel de una fila de k signos sólo 
si es divisible por potencias impares de cada uno de los primeros k primos, y es el 
gódel de una lista de h filas de signos sólo si es divisible por potencias pares de cada 
uno de los primeros h primos. 
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que Gúdel llama aquí “funciones recursivas” es sólo una parte de la familia 
que hoy conocemos por ese nombre.'? Pero —como veremos en el Capítulo 
2.11— la familia completa se forma con sólo añadir dos sencillas operacio- 
nes generadoras a las admitidas por Gódel.!” Como dije al comienzo, es jus- 
tificado pensar que esta familia comprende todas las funciones numéricas que 
es posible computar mediante un algoritmo. Gódel mismo no creyó en un 
principio que la clase de las funciones computables mediante un algoritmo 
se pudiera caracterizar así —sólo se convenció después de leer a Turing 
(1937)— y, por cierto, nunca pretendió que toda función computable fuera 
recursiva en el sentido restringido definido por él en 1931. Pero cada fun- 
ción recursiva en este sentido restringido es computable mediante un algorit- 
mo que se especifica en su misma definición. 

Una función recursiva es una función numérica, esto es, una función cuyo 
dominio y alcance están contenidos en el conjunto N de los números natu- 
rales. En particular, las funciones recursivas en el sentido restringido de Gódel 
están definidas en todo N. Esta clase de funciones se distingue sólo por un 
pequeño detalle de lo que hoy se llama la clase de las funciones recursivas 
primitivas, que definimos así: 


Jesús Mosterín, en su excelente traducción castellana de Gódel, se toma la libertad de 
escribir “recursiva primitiva” donde el original dice “rekursiv” a secas (OC, p. 62). 
Esta iniciativa viola la integridad del documento en un punto esencial para el historia- 
dor de las ideas. Es verdad que la ilustre matemática húngara Rósza Péter (1934) lla- 
mó “primitiv rekursiv” a las funciones “recursivas” de Gódel 1931, pero ese nombre se 
usa ahora en un sentido un tanto más amplio: lo que hoy llamamos funciones recursivas 
primitivas coincide con lo que Gódel llama “funciones recursivas” en 1934 (CW L, p. 
347; OC, p. 169), mas no con lo que Gódel llamó de ese modo en 1931 (la definición 
de 1931 omite la cláusula PR3 de la definición de funciones recursivas primitivas que 
doy enseguida en el texto (vide p. 332). 


13 Una es la indicada en la referida cláusula PR3: La proyección que asigna a cada r- 
tuplo de números naturales su k-ésimo término (1 < k < r) es una función recursiva 
primitiva. Me referiré a la otra en el Capítulo 2.11; pero aquí va un anticipo. Sea uyD(y) 
el más pequeño número natural y que cumple la condición P(y), o el número 0 si nin- 
gún número la cumple. Si q es una función recursiva (n+1)-ádica, entonces también es 
recursiva la función n-ádica y definida por: 


WO +. Xp) = MYCÓ(X]) + Xp Y) 230 A VZ(Z< y > 0(%], - 2) > 0)) 


Kleene (1936) demostró que cualquier función recursiva (en el sentido actual) puede 
expresarse como una función compuesta de no más de dos funciones recursivas primi- 
tivas y una aplicación de la función p. 
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PRI La función sucesor x+> x + 1 es recursiva primitiva. 

PR2 Si r es un entero positivo, la función cero (X;,...,x,) > 0 es 
recursiva primitiva. 

PR3 Si r es un entero positivo, la función (x;,...,x,) > Xx, (1 <k:< r) 


es recursiva primitiva. Esta función se llama la k-ésima proyección 
de N", simbolizada rn”, o simplemente 1,.'* 

PR4 Si h es una función recursiva primitiva m-aria, y g;,... 8, SON 
funciones recursivas primitivas n-arias, también es recursiva primi- 
tiva la función compuesta: 

O E TA e A AE A 0) 

PR5a Sike N y h es una función recursiva primitiva 2-aria, también es 
recursiva primitiva la función 1-aria f definida por la doble condi- 
ción siguiente: 

fO0) = k 
fol) = HO) 


PR5b  Sin>l, g es una función recursiva primitiva (n—1)-aria y h es una 
función recursiva primitiva (n+1)-aría, también es recursiva primi- 
tiva la función n-aria f definida por la doble condición siguiente: 


FO, Xz > -- Xp) = EU > «Xy 
Util a cs) = AO pr ir 1) 


El lector reconocerá sin dificultad que el esquema de recursión señalado 
en el texto de Gódel (1931, p. 179) con el número (2) corresponde exacta- 
mente a PR5b; el esquema de “sustitución” que él ilustra en la nota 27 (p. 
180) corresponde a PR4. Gódel menciona expresamente a PR1 y PR2,!” y 


En rigor, debería indicarse en el nombre de la proyección el valor de r, puesto que la 
¡-ésima proyección de m-tuplos no es la misma función que la ¡-ésima proyección de 
n-tuplos a menos que n = m. Pero, en la práctica, este dato está implícito en el contex- 
to y se prefiere no recargar la notación con un signo alusivo a él. 


De hecho, Gódel menciona una condición más amplia que PR2, a saber: dado un nú- 
mero cualquiera c, la función constante (X;,... ,x,) => c es “recursiva”. Pero esta con- 
dición se deriva fácilmente de PR1, PR2 y PR4 así: en PR4 tómese g igual a la fun- 
ción cero y h igual a la función sucesor reiterada c veces; entonces la función (X,, .... ,X,) 
> c es simplemente la función compuesta (x,, ... x,) > Mg(X],--- X,)). 
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PR5a es en efecto superflua puesto que se la puede derivar de PR5b y PR2. 
Gódel omite la condición PR3, la cual, sin duda, amplía la extensión del 
concepto definido pero no modifica su definición de un modo intuitivamente 
significativo. En particular, la omisión de PR3 no afecta su demostración de 
los teoremas que enuncio en el próximo párrafo. Es fácil ver asimismo que 
las funciones numéricas elementales —suma, multiplicación, exponien- 
ciación— son todas recursivas primitivas. Por ejemplo, si ponemos g(x) = 
Tu(x) y hoya = 100,2) + 1, la función binaria f (x,y) > x + y satisface 
la condición PR5b. Como ilustración de PR3a doy siguiente definición de la 
función factorial x > x!: 0! = 1, (n+1)! = (n+1) - n!.2 

En adelante, escribiré *pr-recursiva” por “recursiva primitiva”, y “recursiva” 
(entre comillas dobles) por 'recursiva en el sentido restringido de Góúdel 
(1931). Un relación numérica n-ádica K se llama pr-recursiva si su función 
característica es pr-recursiva; esto es, si es pr-recursiva la función yx defini- 
da por:?! 


Ax (tj) +... Xp) =0 si (Xp)... y) € K 
Ax Op) +... Xp) = 1 S1(X,... 1) E K 


En la próxima nota muestro que estas dos relaciones diádicas son pr- 


20 En este ejemplo, la función definida fes x > x!; la constante k = 1 y la función auxi- 


liar h es la multiplicación. 


21 Obsérvese que defino la función característica de K asignando el valor O al caso afir- 


mativo, el valor 1 al caso negativo, tal como hace Gódel. En el Capítulo 1.5 fue opor- 
tuno adoptar la convención contraria; cf. p. 43, nota 12. 


2 Para fortalecer su comprensión de lo dicho en el texto, el lector debe probar que las 


funciones características de las relaciones numéricas “igual a” y “menor que” son pr- 

recursivas. Puede utilizar para eso las cinco funciones pr-recursivas que defino a conti- 

nuación: 

(D  pdO0=0, pd(x+1) = x (pd asigna el predecesor de x a cada número x > 0). 

Q) x=0=x,x= (y+1) = pd(x — y) (x — y es igual a x menos y si x > y; de otro 
modo, es igual a 0). 

(3) l-yl=(x= y) + (y — x) (lx — yl es el valor absoluto de la diferencia entre x y y). 

(4) sg(0) = 1, seg(x+1) = O (sg es la función característica de la clase de números 
Lex > 0) = (xx es el siguiente de algún número)). 

(5) nsg(0) = 0, nsg(x+1) = 1 (nsg es la función característica de la clase de números 
Lux = 0) = (x:x no es el siguiente de ningún número). 
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recursivas: [(x,y): x= y) y ((x,y): x < y). Una clase pr-recursiva se define 
del mismo modo, con n = 1. En aras de la brevedad, utilizaré la palabra 
“relación” para designar a clases y relaciones (entiéndase que una “relación 
1-ádica” es una clase). Usaré las negritas para representar n-tuplos, con n > 
1 arbitrario (Gódel usa con este propósito las letras góticas r, 1),...). En 
vez de 'xe K” escribo K(x). Gódel demuestra los siguientes teoremas: Si K 
es una relación pr-recursiva, su complemento K' = (x:K(x)) es pr-recursivo. 
Asimismo, si K y A son relaciones pr-recursivas, también lo es su unión K 
UH. Si la función n-aria q y la función m-aria yw ambas son pr-recursivas, 
la relación (n+m)-ádica ((x,y):d(x) = w(y)) es pr-recursiva. Por último, si la 
función n-aria q y la relación (m+1)-ádica R son pr-recursivas, también los 
son las relaciones S y T y la función “Y definidas por: 


S(x,y) O JU < 00) A R(Z, y) 
Ty) O Vu < 60) > R(,y)) (++) 
Y(y) = zz < $0) a R(z,y)) 


donde uzQD(z) denota el más pequeño número z que cumple la condición D(2), 
o el número O sí ningún número cumple dicha condición. Obsérvese que la 
condición impuesta al número x en la definición de Y incluye una cota su- 
perior o tope bajo el cual ese número tiene que encontrarse. Esto es indis- 
pensable para que la función “Y sea pr-recursiva (cf. la nota 17). Omitiré las 
demostraciones de estos teoremas, que no presentan mayor dificultad (véase 
Gódel 1931, pp. 180-181; OC, pp. 63-65).2 


El lector debe comprobar que la función característica de ((x,y): x < y) es sg(y — x) 

y que la función característica de ((x,y): x = y) es nsg(lx — yl). 
23 En todo caso, es claro que la función Y y los predicados S y T son computables en el 
sentido intuitivo. Por ejemplo, para calcular el valor de la función Y en el (n+m)-tuplo 
(Xi. Xp) 1 + + > Y) Se procede así: 1” Se calcula el valor de la función pr-recursiva 
$ en el n-tuplo (xy, ... ,x,); digamos que (xj, ... ,x,) = a. 2” Se calcula la función 
característica de la relación pr-recursiva R en todos los (m>+1)-tuplos (0,y;,... ,Yn)» 
(Y ++ Jm)» + + > (Y ¡> - - - Y) hasta encontrar uno en que dicha función tome el valor 
O. Si el primer (m+1)-tuplo con esta propiedad es (b,y;, ... ,y,,), entonces b es el valor 
buscado de “Y. Pero si la función característica de R toma el valor 1 en todos los (m-+1)- 
tuplos de la lista indicada, entonces el valor buscado de “Y es O. Para demostrar que Y 
es pr-recursiva basta describir este procedimiento en términos de las condiciones PR1-— 
PRS. 
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4” Inmediatamente antes de abordar el paso 3% aludí a la representación nu- 
mérica de propiedades y relaciones de objetos del cálculo P mediante clases 
y relaciones formadas por los respectivos gódel. Ahora bien, algunas de las 
propiedades y relaciones sintácticas más importantes —como “ser una fór- 
mula” o “ser una prueba'— están representadas de este modo por relaciones 
pr-recursivas. La definición de las funciones características correspondientes 
provee, pues, un algoritmo para determinar si ciertos objetos del cálculo — 
identificados por sus gódel — poseen esas propiedades o están en esas rela- 
ciones. Ello era de esperarse, puesto que P es visiblemente un cálculo efec- 
tivo (en el sentido explicado al comienzo del Capítulo 2.7). La verdadera 
importancia del uso de la representación numérica de categorías sintácticas 
mediante relaciones pr-recursivas se mostrará en el paso 5%. Veremos enton- 
ces que a cada relación pr-recursiva n-ádica le corresponde una fórmula de 
P con n-variables libres (n > 1), que se convierte en una oración demostra- 
ble si las variables se reemplazan con los nombres de números que tienen 
esa relación y en una oración refutable si se las reemplaza con los nombres 
de números que no la tienen. En virtud de ello, el cálculo P contiene una 
teoría deductiva de su propia sintaxis o, más exactamente, de aquellos as- 
pectos de la misma que son representables mediante relaciones pr-recursivas. 
Así se cierra de un modo preciso y riguroso el círculo reflexivo que produce 
el primer teorema de incompletud. 


Gódel (1931, pp. 182-186) define 45 relaciones y funciones pr-recursivas 
que representan categorías sintácticas o sirven para definir a otras que las 
representan. Las que representan categorías sintácticas se designan con el 
nombre de la categoría representada impreso en VERSALITAS (de acuerdo con 
la convención que expliqué al final del 2%). Importa tener presente que las 
definiciones no se enuncian en el cálculo P, sino en la lengua (alemán, cas- 
tellano) en que se conduce el discurso sobre el cálculo. Para mayor claridad, 
Gódel utiliza abreviaturas e ideogramas, introducidos ad hoc o tomados del 
álgebra ordinaria y del cálculo predicativo de Hilbert y Ackermann (estos 
últimos se sustituyen aquí con los signos homólogos de nuestro CP). Reco- 
miendo enfáticamente al lector que, para su propio consumo, exprese en 
palabras las 45 definiciones (así como la definición N* 46 de una clase de 
números que no es recursiva). A continuación doy unos pocos ejemplos. Los 
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dos primeros ilustran las relaciones pr-recursivas S y T' (destacadas arriba 
con el signo *), respectivamente. 

l. x es divisible por y —abreviado x/y— si y sólo si hay un z menor o 
igual que x, tal que x= y- z. 

2. x es primo —abreviado Prim(x)— si y sólo si no hay un z mayor que 
1 y menor que x tal que x es divisible por z. 

Los cinco ejemplos siguientes son funciones pr-recursivas análogas a la 
función Y (destacada con +»). 

3. El n-ésimo factor primo del número x se designa con n Pr x.% El si- 
guiente esquema de recursión muestra que ésta es una función pr-recursiva: 


OPrx=0 
(n+1) Prx=uy0<x a Prim(y) A x/y an y > n Pr x) 


En palabras: El 0O-ésimo factor primo de x es 0; el (n+1)-ésimo primo con- 
tenido en x es ya sea (1) el más pequeño número y menor o igual que x tal 
que y es primo, x es divisible por y y y es mayor que el n-ésimo primo con- 
tenido en x, ya sea (11) O, si no existe un número y que cumpla estas condi- 
ciones. 

5. El n-ésimo primo es el valor asignado al número n por la función pr- 
recursiva x > p,.2 Esta función se define así: 


py=0 
Pai = M0 <€ 1+p,! A Prim(y) A y > p,,) 


En palabras: El 0-ésimo primo x es O y el (n+1)-ésimo primo es el más pe- 
queño número y, menor o igual que el siguiente de 1- 2-3 -...- p,, tal que 
a Uso redonda para la abreviatura de los predicados recursivos (como Prim), y cursiva 
para la de las funciones recursivas (como Pr). Gódel sigue esta norma en las primeras 
definiciones, pero luego se aparta de ella (ver. en las definiciones 13 y 17). Ello no 
tendría la menor importancia si no fuese por su cuestionable práctica de utilizar el mismo 
símbolo '=” como signo de equivalencia en la definición de los predicados y como 
signo de identidad en la definición de las funciones. Por mi parte, usaré +” para sig- 
nificar equivalencia y '=" para significar identidad. 

29 En vez de p,, Gódel escribe Pr x. Esta abreviatura difiere de la usada por él mismo (y 
por nosotros) cuando asigna números de identidad a los objetos del cálculo. Además, 
se parece mucho al nombre de la función binaria definida bajo el número 3. 
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y es un número primo mayor que el n-ésimo primo. Para fijar el tope bajo el 
cual ha de buscarse el (n+1)-ésimo primo Gódel aprovecha elegantemente la 
clásica prueba de que tal número existe, para todo n (Euclides, 1X.20). 

6. La función binaria (n,x) > n Gl x asigna al par (n,x) el exponente del 
n-ésimo factor primo de x en la factorización prima de este número (siem- 
pre, claro está, que n sea mayor que O y menor o igual que el número de 
factores primos de x). Se define así: 


nGlx=u<xn xn Pr xY a —x/((n Pr xy*!) 


En palabras: el número en cuestión es ya sea (1) el más pequeño número y 

< x tal que x es divisible por la y-ésima potencia del n-ésimo factor primo 

de x, pero no es divisible por la (y+1)-ésima potencia de ese primo; ya sea 

(11) O si ese número no existe. La utilidad de esta función reside en que, si 

xes el gódel de una fila de signos o una lista de filas de signos de P, n Gl 

x es el gódel del n-ésimo signo de esa fila o de la n-ésima fila de esa lista.? 
7. La función x —> /(x) se define así: 


(0) =MO<xna (y Prx)>0n ((y+1) Pr x) = 0) 


Según esto, /(x) es el más pequeño número y tal que existe un y-ésimo mas 
no un (y+1)-ésimo factor primo de x (claro está que si x no tiene ningún 
factor primo —esto es, six=0Ó6x=1— /(x) = 0, de acuerdo con la defi- 
nición del operador pu). Así, l(x) asigna a cada número x el número total de 
sus factores primos. Por lo tanto, si x es el gódel de una fila de signos o de 


26 Conviene observar que la explicación en palabras de la definición 6 ofrecida por Gúdel 


es incorrecta. Dice que n Gl x es “el n-ésimo término (Glied) de la secuencia de núme- 
ros correspondiente al número x” (1931, p. 182). Alude aquí a la biyección que esta- 
bleció entre los números y los k-tuplos de números (para todo entero positivo k) en el 
paso 2” (y que omití, por superflua, en mi explicación de ese paso). En virtud de ella, 
cada k-tuplo corresponde a un número cuyo factor primo más grande es p;; en particu- 
lar el k-tuplo (n(1),n(2), .. . ,n(k)) corresponde al número 2". 39... p"%, Así, 
el número 766.360, cuya factorización prima usé arriba como ejemplo, es igual a 23 x 
30x 51 x 7 x 110 x 132x 17! x 19 x 23! y corresponde, por lo tanto, al 9-tuplo 
(3,0,1,2,0, 0,1,0,1)). Ahora bien, el quinto término de esta secuencia de números es O, 
pero según la fórmula de la definición 6 —como el lector verificará fácilmente — 5 Gl 
766.360 = 1 (puesto que 5 Pr 766.360 = 23 y 766.360 es divisible por 23! mas no por 
23?). El error de Gódel es inocuo, porque no hay ningún objeto a. del cálculo tal que 
tt[a] = 0. 
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una lista de filas de signos, /(x) es el número total de signos en esa fila o de 
filas en esa lista; en otras palabras, su “longitud”. 
8. La función binaria (x,y) > x * y está dada por: 


x * y = uz € Por Y A Vn(n < Lx) > n Glz=m Gl x) 
AVn(0 <n< l(y) > (n+0(0)) Gl z = n Gl y)) 


Esta definición?” está pensada para asegurar (i) que si x = 4[8] y y = *[n], 
donde € y n son filas de signos de P, x x y = *[£_n], donde ¿_n es la fila 
que se forma prefijando € a n, y (11) que si x = 4[£] y y = *[Y], donde X 
y Y son listas de filas de signos de P, x * y es el gódel de la lista que se 
forma añadiendo la lista Y a continuación de la lista £. Consideraré el caso 
(1), dejando el (11) como ejercicio al lector. Sean pues € y n dos filas de 
signos, tales que x = *[8] y y = *[n]. Entonces, la fila £€_n contiene preci- 
samente /(x) + 2(») signos y el factor primo más grande de *[8_n] €s Py)+1(,) 
Verifiquemos que +*[£_n] es el más pequeño número z que cumple las tres 
condiciones enunciadas en el alcance de 11z. Tenemos que 


_p16Glx 160) Gl> 1Gly 1() Gl y 
TAM Pa Da 


Este número cumple evidentemente la segunda condición: los exponentes de 
sus primeros /(x) factores primos coinciden uno por uno con los exponentes 
de los factores primos de +[8] = x (ordenados de menor a mayor). También 
cumple la tercera: sus últimos /(y) factores primos coinciden uno por uno 
con los exponentes de los factores primos de [nm] = y (ordenados de menor 
a mayor). Además, este número no puede ser mayor que Pyery +0”. En 
efecto, HE_n1=xX- Pra! Y... Perry A? Y. Obviamente x < Decre) 


Gl y Uy) Gl y < 


Dia y 
090) 
Pot Ad Ahora bien, cada uno de los factores primos del número de la 


Por consiguiente, bastará mostrar que Py,1" 


izquierda es menor o igual que py,,,1,. Como el número de esos factores 
es /(y), el producto de todos ellos, elevado al respectivo exponente es menor 
o igual que Py, e Por lo tanto, ++[£_1] cumple nuestras tres condicio- 


dl He introducido un cambio inocuo en la definición de Gódel para facilitar la explica- 


ción que sigue. El tope para el número z en la definición original es Pyx)+yy >. Al 
adoptar un tope mayor me será más fácil probar que cierto número que vamos a con- 
siderar no lo excede. 
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nes. Supongamos ahora que hay otro número u que también las cumple. En 
tal caso, obviamente, /(u) = ((<) + £(y), y para todo n, n Gl u=n Gl +[8_n]. 
Si *[8_n] + u, por lo menos uno de los factores primos de +[£_n] no es un 
divisor de u. Por lo tanto, hay un q > 1 tal que para todo r mayor o igual 
que q y menor o igual que /“(x) + £(y), p, < r Pr u (el r-ésimo factor primo 
de u). Como p, es el r-ésimo factor primo de +[£_n] y su exponente en la 
factorización prima de *[£_n] es idéntico al exponente de r Pr u en la 
factorización prima de u, es claro que *[£_n] + u implica que 4*[£_n] < u. 
Por lo tanto, +f[8_1n] es el número más pequeño que cumple las condiciones 
en cuestión. 

Después de esta justificación detallada de la definición 8, el lector podrá, 
espero, entender el empleo de la función x * y en las definiciones siguientes. 
Componiéndola con la función pr-recursiva R:x => 2*, es posible definir cla- 
ses pr-recursivas que representan numéricamente distintas categorías de ex- 
presiones del cálculo. Obviamente, si x es el gódel de un signo del cálculo, 
R(o) = 2* es el gódel de la fila que consta solamente de ese signo. Por lo 
tanto, si a es una fila de signos y x = la], R(11) * x * R(13) —abreviado 
E(x)— es el gódel de la fila (a); R(S) * E(x) —abreviado Neg(x)— es el 
gódel de la fila —(a.); si € es una variable y z = 4*[€], R(Z) * R(9) + E(x) — 
abreviado z Gen x— es el gódel de la fila Él I(a.), y así sucesivamente. Com- 
binando varias de estas definiciones, Gúdel logra definir, entre otras, la pro- 
piedad pr-recursiva Form(x) —x es una FÓRMULA— que caracteriza a los gódel 
de las fórmulas de P (Def. 23). 

Me detendré un momento a considerar la definición de NUMERAL, el atri- 
buto distintivo de los gúdel de las expresiones 0, f0, Ff0, FFf0,...., F”0,... 
que representan en el cálculo P a los números naturales 0, 1,2,3,...,n,... 
Primero se define la función pr-recursiva binaria (x,y) > y N x: 

16.0Nx=x(nm+l)Nx=RG)*nNÑ x. 

Obviamente, si x es el gódel de la fila de signos a, n N x es el gódel de 
la fila formada por a. precedida de n copias del signo f. Como 1 = 4[0], n 
N R(1) es el gódel del numeral que representa el número n en P. Por lo tan- 
to, n N R(1) es el NUMERAL de n. En vez de n N R(1), escribimos con Gódel 
Zí(n) (Z por Zahl, número”). Por ejemplo, 


Z(4) = HLffff0] = 2? - 33. 53. 72. 111 = 101.871.000 
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Recomiendo especialmente al lector que estudie la definición 31, pues la fun- 
ción Sb(xy) a que se refiere tiene un papel destacado en la demostración del 
Teorema VI. Si x, v e y son, respectivamente, los gódel de una fórmula q, 
una variable v, y una fila de símbolos n, Sb(xy) es el gúdel de la fórmula 


que se obtiene al reemplazar v por n en cada una de las posiciones donde v 
está libre en q. 
La cadena de definiciones culmina con éstas: 

43. Fl(x,y,2) O y = (2 [mp x) v Ju(u< x A Var(u) a (x = u Gen y) 
Léase: x es una CONSECUENCIA INMEDIATA DE y y z si y sólo si hay entre estos 
tres números una de las dos relaciones enunciadas a la derecha del signo >. 
Aquí Var es la clase de los gódel de las variables de P (Def. 12), u Gen y es 
la función R(u) *« R(9) x* R(y) (Def. 15) y z Imp x es la función E(R(5S) * 
E ( Z ) ) 

* R(7) x* E(x) (Defs. 32, 13 y 14). Por lo tanto, si x, y, z y u son, respectiva- 
mente, los gódel de las fórmulas €, n, £ y de la variable v, u Gen y = *[vl In] 
y z Imp x = *[-(m)»vg8]. Por lo tanto, Fl(x,y,z) si y sólo si x es el gódel de 
una consecuencia inmediata por modus ponens de las fórmulas cuyos gódel 


son y y z 0 de una consecuencia inmediata por generalización de la fórmula 
cuyo gúdel es y (en cuyo caso Fl(x,y,z), cualquiera que sea 2). 
44. Bw(x) So (160) > 0) a Vn(0 <n< l(x) > Axí(n Gl x) v Julw(0 
<uw <n an Fl(n Gl x,u Gl x,w Gl x)) 
Léase: x es una PRUEBA? si y sólo si x tiene al menos un factor primo y el 


exponente n Gl x de cada primo p, < py, en la factorización prima de x es 
ya sea (1) el gódel de un axioma de P (véase Def. 42), ya sea (11) el gódel de 
una consecuencia inmediata por modus ponens de dos fórmulas cuyos gódel 
son, respectivamente, los exponentes en la factorización prima de x de dos 
primos p,, Y P,, menores que p,, ya sea (111) el gúdel de una consecuencia 


SS En alemán, BEWEISFIGUR, literalmente “figura de prueba”. Esta denominación es impro- 


pia, puesto que lo que normalmente se llama así, también en alemán, es un esquema 
que, al llenarse con fórmulas del cálculo, genera una prueba. Pero Bw(x) si y sólo si x 
es el gódel de una lista de oraciones de P que constituye efectivamente una prueba. 
Mosterín traduce “BEWEISFIGUR” por “DEDUCCIÓN” (Gódel, OC, p. 70). Esta traducción me 
parece inobjetable. No la adopto, sin embargo, porque ello me obligaría a usar “deduc- 
ción” en otros pasajes de este libro como equivalente al inglés “proof” —como, conse- 
cuentemente, hace Mosterín en su traducción de Gódel 1934 (OC, p. 182)— y a llamar 
“teoría de la deducción”, en vez de “teoría de la prueba”, a la Beweistheorie de Hilbert. 
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inmediata por generalización de una fórmula cuyo gódel es el exponente en 
la factorización prima de x de un primo p, < p,, En otras palabras, Bw(x) si 
y sólo si x es el gódel de una prueba en P. 

45. xBy £€ Bw() A y = (U(x) Gl x). 
Léase: x es una PRUEBA DE y si y sólo si x es una PRUEBA y y es el exponente 
en la factorización prima de x del máximo divisor primo de x. Obviamente, 
xBy si y sólo sí hay una prueba cuyo gúdel es x, e y es el gódel de la última 
fórmula de esa prueba. 

46. Bew(x) £ J1y(yBx). 
Léase: x es una FÓRMULA DEMOSTRABLE si y Sólo si hay un número y tal que 
y es una PRUEBA DE x. Obviamente, Bew(x) si y sólo si existe en P una prue- 
ba cuya última fórmula tiene el gódel x. 

Gódel observa agudamente que —en contraste con todas las definiciones 


anteriores— no podemos aseverar que la def. 46 defina una clase 
“recursiva”.22 Obsérvese que, si (x:Bew(x)) fuese “recursiva”, podríamos 
emplear el algoritmo de su función característica para decidir, dada una fór- 
mula q, si 4[4] pertenece o no a (x:Bew(x)). Podríamos, entonces, determi- 
nar mediante un algoritmo si Fp o 4q. En otras palabras, habríamos resuelto 
el Entscheidungsproblem del cálculo P. Como veremos en el Capítulo 2.11, 
en virtud de los hallazgos de Gódel, ni siquiera es posible resolver el Ent- 
scheidungsproblem del cálculo predicativo de primer orden (que es sólo un 
fragmento de P). 

5 El próximo paso consiste en establecer que para cada relación “recursiva”% 
n-ádica R y cada n-tuplo de números a hay una fórmula de P con n varia- 
bles libres $(€) tal que, si er es la lista de los numerales correspondientes a 
a, Fp(0/E) sia e R y F-(0(q/E)) si a ¿ R. Como expliqué en la p. 250, 


e El predicado Bew(x), definido por generalización existencial sobre una de las variables 


libres del predicado binario recursivo yBx, es lo que hoy se llama un predicado recur- 
sivamente enumerable. Esta designación se basa en lo siguiente: puede demostrarse que 
si un predicado definido de este modo es satisfecho por una clase no vacía de núme- 
ros, dicha clase es el alcance de una función recursiva (general) con dominio Ni; ésta 
puede entonces utilizarse para enumerar la clase de números en cuestión (y también, 
por cierto, cualquier clase de objetos identificados mediante esos números). 


cb Recuérdese que llamo así —con el adjetivo entre comillas— a las relaciones recursivas 


en el sentido restringido de Gódel (1931), o sea, las relaciones cuya función caracterís- 
tica es pr-recursiva conforme a las reglas PR1, PR2, PR4, o PR5. 
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nota 4, una relación numérica con esta propiedad es precisamente lo que 
Gódel (1931) llama decidible (entscheidungsdefinit) en P. Estableceremos, 
pues, que las relaciones “recursivas” son P-decidibles (como diré para evitar 
la confusión con otras acepciones de *decidible” a que me refiero en esa nota). 
A la luz de lo expuesto en el paso 4”, esto significa que una parte conside- 
rable de la sintaxis lógica de P es materia de una teoría deductiva formalizable 
en P. 

Este resultado está contenido en el Teorema V, el cual dice que para cada 
relación “recursiva” n-ádica R hay un número r tal que (1) r es el gódel de 
una fórmula con exactamente n variables libres +[17], +[19], +[23],....,, 
tlP,.6l;*! (11) si s es el gódel de la fórmula obtenida al reemplazar la varia- 
ble t[p;,6)], en todas las posiciones libres que ésta ocupa en la fórmula +[r], 
por el numeral correspondiente a cierto número a, (1 < k < n), entonces 
Bew(s) si R(a,,...,a,) y Bew(R(5) * E(s)) si =R(a;,... a,). Como se re- 
cordará, Bew(s) si y sólo si la fórmula +[s] es demostrable en P, y Bew(R(5) 
x* E(s)) sí y sólo si la negación de la fórmula +[s] es demostrable en P. 

Como tendremos que referirnos a menudo al Teorema V, conviene dispo- 
ner de una terminología concisa para aludir a él. Si un número r tiene con 
una relación R la conexión arriba descrita, diré que r es el número corres- 
pondiente a R y que la fórmula +[r] expresa a R según el Teorema V. Esta 
última designación (inspirada por Kleene 1952, p. 195) es, por cierto, pura- 
mente convencional y arbitraria si P es un sistema deductivo inconsistente. 
Pero sí P es consistente, la designación se ajusta bien al significado corrien- 
te del verbo “expresar”, puesto que, en tal caso, la fórmula obtenida al reem- 
plazar por numerales todas las variables libres de +[r] es demostrable en P 
si y sólo si los números designados por dichos numerales tienen entre sí la 
relación R.? 


3 Recuérdese nuestra convención: si a = 4[b], b = t[a]. Gódel no especifica cuáles son 


las n variables libres en la fórmula +[r]; pero en la nota 38 (1931, p. 186) sugiere el 


método utilizado arriba. 


32 Consíderese, por ejemplo, una relación diádica R(x,y) y sea p(u,.,v,) la fórmula +[r] 


que la expresa según el Teorema V. Sean m y n dos números. Según la convención 
adoptada arriba, los numerales correspondientes son f"0 y f"0. En tal caso, —R(m,n) 
implica que F=p(f"0,f"0) y, por lo tanto, si P es consistente, -p(f”0,f"0) implica que 
—=P=p(f”0,f"0) y, por ende, que ——R(m,n) y que R(m,n). 
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Aunque el Teorema V propiamente pertenece a la aritmética —habla sólo 
de relaciones entre números— el razonamiento que Gódel ofrece como prueba 
se funda en ciertas propiedades del cálculo P. Como observa en una nota, 
“el Teorema V se basa, naturalmente, en que, si R es una relación recursiva, 
es posible deducir de los axiomas del sistema P si un dado n-tuplo de núme- 
ros posee o no esa relación” (1931, p. 186, n. 40). Basta probar el Teorema 
V para toda relación “recursiva” n-ádica R que satisfaga la condición 

RX. Xp) O x= 0(%,,... X,) (1) 
donde ( es una función “recursiva”; por cuanto, si R es una relación 
“recursiva” n-ádica cualquiera, la relación R' = ((0,x,,... Xx): R(X], +. X,)) 
cumple la condición (1), con q la función característica de R. Si q, en la 
condición (1), es la función “el siguiente de” (“recursiva” por PR1), R es la 
relación diádica que subsiste entre dos números si el segundo es el predece- 
sor del primero. En tal caso, la ecuación a la derecha del signo <> en (1) 
puede obviamente representarse en P mediante la fórmula x, = fy,. Sea a. la 
fórmula obtenida al reemplazar aquí el par de variables (x,,y,) por el par de 
numerales correspondientes a los números a, y a,. Es claro que Fa si a, = 
a,+l y que Ea si a, + a,+1.2% Lo mismo vale, a fortiori, si p, en la con- 
dición (1), es una función constante (“recursiva” por PR2).** Diré, con Gódel, 
que una función “recursiva” tiene grado 1 si está definida según PR1 o PR2, 
y que tiene grado n+1 si está definida según PR4 o PRS a partir de otras 
funciones “recursivas” entre las cuales hay por lo menos una de grado n > 
1. Supongamos que el Teorema V ha sido demostrado para todas las relacio- 
nes “recursivas” que cumplen la condición (1) con una función q de grado 
menor que un cierto entero positivo r. No es difícil ver que, en tal caso, el 
Teorema V también vale para una relación “recursiva” que cumpla la condi- 


33 Por ejemplo, si a, = 4 y a, =3, 0. es la fórmula ffff0 = FFfff0. Sia,=4 y a,=5.0a 


es la fórmula £fff0 = FffFfffO. Aquella fórmula y la negación de ésta se deducen 


fácilmente de los axiomas 1.2 y 1.1. 


34 Sea, por ejemplo, q la función (n-1)-ádica (x», . . . ,x,) +> 2. Entonces, la ecuación a la 


derecha del signo <> en (1) puede representarse en P mediante la fórmula x, = ff0. 
Sea a la fórmula obtenida al reemplazar aquí la variable x, por el numeral correspon- 
diente a un número cualquiera a,. Es claro entonces que, cualquiera que sea el (n-1)- 
tuplo (a), ... ,4,), R(Aj,... a) S 41 =2 0 a es la fórmula *ff0 = ff0”. 


2.10 Los Teoremas de Incompletud de Gódel 344 


ción (1) con una función q de grado r; aunque una demostración rigurosa 
sería larga y tediosa. Puesto que el Teorema V vale, como vimos, si la fun- 
ción q es de grado 1, vale, con toda generalidad, para cualquier grado. 


6” Nos falta todavía un breve paso antes de abordar por fin el primer teore- 
ma de incompletud (Teorema VI). Es claro que si P fuese inconsistente, toda 
oración sería deducible de los axiomas. Tendríamos entonces que, cualquiera 
que fuese la oración a., Fa y Fa. Por lo tanto, la consistencia de P cons- 
tituye una condición sintáctica necesaria para que P sea incompleto (en el 
sentido de Post). Rosser (1936) demostrará que esta condición también es 
suficiente. Pero Gódel (1931) estableció originalmente la incompletud de P 
bajo una condición sintáctica más fuerte, que llama “«w-consistencia”. Podría 
pensarse que, en vista del resultado de Rosser, no vale la pena molestarse en 
estudiarla. Pero —como indico al final del próximo párrafo— la noción de 
o-consistencia tiene cierto interés en relación con el programa de Hilbert. 
Gódel la define de un modo preciso pero un tanto esotérico. Nuestro penúl- 
timo paso consistirá, pues, en explicar esa definición. 

Sea K una clase de fórmulas de P. La clase D(K) de las fórmulas deducibles 
de K es la clase de fórmulas que contiene (1) todas las fórmulas de K, (11) 
todos los axiomas de P y (111) toda fórmula de P que se deduzca de dos 
fórmulas de D(K) por modus ponens o de una fórmula de D(K) por genera- 
lización. (D(K) es, pues, el conjunto de teoremas de la teoría deductiva que 
se obtiene añadiendo las fórmulas de K a los axiomas de P, o sea, lo que 
comúnmente se llama la extensión de P determinada por K). Obsérvese que, 
según esta definición, la clase de las fórmulas deducibles de los axiomas de 
P es D(W). Diré que K es o-inconsistente si y sólo si hay una fórmula D(u), 
con una sola variable libre u, tal que D(K) contiene a la vez la fórmula 
<ull(D(u)) y todas las fórmulas que pueden obtenerse reemplazando la va- 
riable libre u en O(u) por el nombre de un número natural. Si D(D) cum- 
ple la condición antedicha, todo conjunto de fórmulas de P será (-inconsis- 
tente; en tal caso, digo que el propio sistema P es (-inconsistente. Si la cla- 
se de fórmulas K no es o-inconsistente, diremos que es o0-consistente. Dire- 
mos, por otra parte, que K es (simplemente) consistente si D(K) no contiene 


Como el lector recordará, la fórmula —ull(P(u)) “traduce” la fórmula familiar -V¿D(8) 
al cálculo P. 
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la negación —a. de una fórmula a e D(K). Obviamente, si K es (-consis- 
tente, también es consistente; pero no es obvio que K sea (-consistente, si 
es consistente. Gódel fue, aparentemente, el primero en ver que hay casos 
de consistencia acompañada de o-inconsistencia. La representación formal 
de la aritmética —o de una teoría matemática que la incluya— mediante un 
sistema deductivo wM-inconsistente sería, por cierto, un desastre. Por lo tanto, 
para fundamentar la matemática clásica en el espíritu del programa de Hilbert, 
hay que valerse de medios finitos para certificar no sólo la consistencia, sino 
también la cv-consistencia de la representación formal adoptada. 

Fiel a la práctica que estudiamos en el paso 4”, Gódel define la o-consis- 
tencia como un atributo de ciertas clases de FÓRMULAS, esto es, de las clases 
de números formados por los gódel de las fórmulas de ciertas clases. El 
definiens se expresa también en términos de clases de números (1931, p. 187). 
Sea k la clase de los gódel de nuestra clase arbitraria K. Gódel llama Flg(x) 
—Flg por Folgen, *consecuencias?'— a la intersección de todas las clases de 
números que (1) incluyen la clase k, (11) incluyen la clase de los AXIOMAS 
(esto es, los gódel de los axiomas) y (111) están cerradas con respecto a la 
relación CONSECUENCIA INMEDIATA (Def. 43).%% Obviamente, Flg(x) es la clase 
de los gódel de la fórmulas pertenecientes a nuestra clase D(K). La clase xk 
de números es (-consistente según la definición de Gúdel si y sólo si la 
clase K de fórmulas es w(M-consistente según la nuestra, esto es, si no existe 
ningún número a tal que, siendo a el gódel de una fórmula A(u) con la sola 
variable libre u, Flg(«) contenga a la vez (1) el número Neg(+*[u] Gen a) = 
*[—ull(A(1)] y (11) para todo número n, el gódel de la fórmula obtenida al 
reemplazar u por el numeral f”0 en todas las posiciones libres de u en A(u). 
(El lector debe persuadirse de que el primer componente de la conjunción 
utilizada por Gódel en su definición expresa la condición (11) y el segundo 
la condición (1); cf. Defs. 13, 15 y 30.). 


7% Con los recursos que hemos acumulado en los pasos anteriores, podemos 
demostrar el Teorema VI, llamado comunmente el primer Teorema de 
Incompletud de Gódel. En la parte introductoria de su artículo Gódel da una 


sad Decimos que k está cerrada respecto de la relación triádica CONSECUENCIA INMEDIATA Si, 


para cualquier trío de números x,y,z tales que y,z e k y Fl(x,y,z), también xe k. 
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demostración informal del mismo, que reproduje al comienzo de esta sec- 
ción. Ella ha inspirado la mayoría de las presentaciones posteriores. Como 
numerosos filósofos han querido reclutar la fuerza de este teorema para di- 
versas causas. me parece importante explicar lo mejor posible la cosa mis- 
ma, esto es, la demostración formal de Gódel. Se trata de un argumento 
estrictamente combinatorio, en que partiendo de premisas ya establecidas — 
casos particulares del Teorema V— se avanza, por pura manipulación de 
signos, hasta llegar a la conclusión. Hay que cerciorarse de la legitimidad de 
las sustituciones efectuadas, y para esto hay que tener presente las corres- 
pondencias entre los objetos designados por los diversos ideogramas que se 
utilizan. Pero no siempre hace falta conocer a los objetos mismos. Hay que 
atender a las relaciones de implicación o equivalencia entre las oraciones 
mencionadas, pero no es preciso entender lo que estas oraciones significan. 
Para refrescar la memoria, doy aquí una lista de ideogramas que se utiliza- 
rán con frecuencia: 


(1 ta designa el gódel de a. (si a. designa un objeto del cálculo P); 

(11) f[x] designa el objeto de P cuyo gódel es x (si x es un número que 
es también un gódel); 

(111) f"0 designa una fila formada por n copias del signo *f” seguidas del 
signo “0”; esta fila es el numeral que representa el número n en P; 

(iv) Z(n) = +f"0; en otras palabras, Z(n) es el gódel del numeral que 
representa al número n en el cálculo P; 

(v) el 17 y el 19 —los dos primeros primos mayores que 13— son los 
gódel de dos variables de tipo 1; llamaré u, a la variable +[17] y v, 
a la variable +[19]; 


(vi) Sb(y 1?) es el gódel de la fórmula que se obtiene al reemplazar la 
Zb 8 q 


variable +[19] por el numeral de y (esto es, la fila f0) en todas las 
posiciones libres que ocupa dicha variable en la fórmula +[y]; 


(vii) [SD (y Ey es la fórmula obtenida mediante el reemplazo descrito 
bajo el (vi); 

(viii) Neg(r) es el gódel de la fórmula obtenida prefijando el signo *=” a 
la fórmula +[r]; 

(1x) 17 Gen r es el gódel de la fórmula que se obtiene prefijando a la 
fórmula +[r] la variable +[17] seguida del signo de cuantificación 
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universal “II”, seguido del paréntesis izquierdo *(” y agregando el 
paréntesis derecho *)” al final de la fila de signos así obtenida; por 
lo tanto, +[17 Gen r] es la fórmula designada, conforme a nuestras 
estipulaciones, por el ideograma u,IICf[r]). 


El primer Teorema de Incompletud de Gódel (Teorema VI) dice que para 
cada clase “recursiva” (-consistente k de FÓRMULAS hay una FÓRMULA CON 
UNA VARIABLE LIBRE 7r tal que ni v Gen r ni Neg(v Gen r) pertenecen a Flg(x) 
(donde v es el gódel de la variable libre en la fórmula +[r]). Esto significa 
que, si K es la clase (w-consistente de fórmulas de P representada por la cla- 
se “recursiva” de números k, hay una fórmula D(u), con una sola variable 
libre u, tal que ni ulI(D(u)) ni -ull(O(u)) pertenecen a D(K). Como Y es 
obviamente “recursiva”, el teorema implica que hay una fórmula P(u), con 
una sola variable libre u, tal que ni ulK(P(u)) ni —ull(O(u)) son deducibles 
de los axiomas de P, de modo que el sistema deductivo P es incompleto en 
el sentido de Post. Pero también implica que esta incompletud no puede 
corregirse ampliando la lista de axiomas, si se requiere que la lista ampliada 
sea (M-consistente y “recursiva”. Como ya señalé, Rosser (1936) demostró 
que el requisito de (-consistencia se puede reemplazar por el simple requi- 
sito de consistencia. Además, en lugar de pedir que la lista de axiomas sea 
“recursiva”, en el sentido restringido de Gúódel (1931), basta exigir que sea 
recursiva, en el sentido más amplio actual, para que el sistema ampliado siga 
siendo incompleto, si es consistente. Por lo tanto, para que P se convierta en 
un sistema deductivo completo en el sentido de Post habría que añadirle 
axiomas hasta el punto de que (1) cualquier fórmula de P pueda deducirse de 
ellos o (11) sea imposible determinar, mediante el algoritmo de una función 
recursiva, si una fórmula dada es o no es un axioma. 

Diré que una lista de fórmulas de P es una prueba desde K si cada fórmu- 
la de la lista es un axioma de P, o un miembro de K, o una consecuencia 
inmediata de una o dos fórmulas que la preceden en la lista. Conforme a 
nuestras definiciones, una fórmula es deducible de K si y sólo si es la última 
fórmula de una prueba desde K. La definición de los conceptos Bw,(x), xB,.y 
y Bew,(x) que sigue al enunciado del Teorema VI, adapta a las pruebas des- 
de K los conceptos Bw(x), xBy y Bew(x) (Defs. 44-46). Si la clase k de los 
gódel de las fórmulas de K es “recursiva”, también lo son la clase (x:Bw,(x)) 
de los gódel de las pruebas desde K y la clase ((x,y):xB,y) de pares de 
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números tales que el primero es el gódel de una prueba de la fórmula cuyo 
gódel es el segundo; mas no la clase (x:Bew,(x)) = Flg(x), esto es, la clase 
de los gódel de las fórmulas deducibles de K. Como es obvio, cualquiera 
que sea la clase de fórmulas K' representada por la clase de números k, si la 
fórmula +[x] tiene una prueba, tiene una prueba desde K. En otras palabras: 


Vx(Bew(x) > Bew,(x)) (2) 


Gódel llama O(x,y) a la relación —xB,(5b (y y) Esta relación, evidente- 
mente “recursiva”, existe entre los números x e y si x no es el gódel de una 


prueba desde K de la fórmula [Sb(y 2] (descrita en la p. 346 bajo el (vii). 


Combinando (2) con el Teorema V, concluimos que hay una fórmula con 
sólo dos variables libres, tal que, si q es el gódel de esa fórmula, entonces: 


—xB (SD (y 2 )) > Bew,Sb(g Lio 2p)) 
(3) 
xB (SD (y Z¿)) > Bew,(Neg(Sb (q Y.) Zíp))) 


En lo sucesivo llamo G(u,,v,) a la fórmula f[q] que expresa según el 


Teorema V la relación O(x,y).2% Sea Y la fórmula +[Sb(y 2), y sea O la 


dd La abreviatura O(x,y) no vuelve a figurar en la demostración del Teorema VI, pero le 


sirve más adelante para referirse a la relación —xB,(Sb(y (y)) en la demostración del 


Teorema XI (1931, p. 197). Nosotros también nos valdremos de ella en ese contexto. 


dd Por cierto, “G(u,,v,)” no es la fórmula con gódel q, puesto que no es una fórmula del 


cálculo P. *G(u;,v;)” es el nombre que le doy a la fórmula con gódel q en mi discurso 
sobre el cálculo. Según la práctica descrita en el Apéndice IX.A, combino el nombre 
“G(u,,v,)” con signos de P para formar nombres que designan otras fórmulas bien de- 
terminadas de P. Por ejemplo, *—uII(G(u,,v,)) designa la fórmula formada por la fila 
—u,Il, seguida por el paréntesis izquierdo, seguida por la fórmula llamada G(u;.v;), 
seguida por el paréntesis derecho. Para aligerar la tipografía, llamo G(u,,f”0) a la fór- 
mula obtenida al reemplazar la variable v, por el numeral f”0 en todas las posiciones 
libres de v, en G(u,,v¡). Según la convención descrita al final del Apéndice IX.A, dicha 
fórmula debiera llamarse G(u,,v,)Lf”0/v,]. 
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fórmula +[Sb(q Zo 20] obtenida al reemplazar en G(u,,v,) las variables li- 
bres u, = F[17] y v, = +[19] por los numerales f%0 = +[Z(0)] y PO = +[Z0)), 
respectivamente. Con esta nomenclatura, las dos implicaciones enunciadas 
en (3) pueden simbolizarse también así: 


—xMB, (FP) —> Bew, (O) 
(15 
xB Y) —> Bew,(Neg(H0)) 


Según esto, (O) es deducible de K si x no es el gódel de una prueba de 'P 
desde K y 0 es deducible de K si x es el gódel de una prueba de Y desde 
K. 

Sea p = 17 Gen q = 4lu,IL(G(u,,v,))] y sea r = Sb(q Lp) res el gódel de 
la fórmula G(u,,f”0) que se obtiene al reemplazar en G(u,,v,) la variable libre 
v, por el numeral f”0 = +[Z(p)]. Haciendo las sustituciones pertinentes com- 
probamos que: 


Sb(p Loy =Sb((17 Gen Dep) =17 Gen Sb(q Ley =17 Gen r (4) 


Sb(q lu 2) =5b (2) (5) 


Si reemplazamos y por p en (3) obtenemos las dos implicaciones siguientes: 


—xB (Sb (p 22, )) > Bew,£Sb (q 2.) Zip) (6) 
xB(Sb(p 22,)) > Bew¿(Neg(Sb (q Y.) Zip) )) (7) 


Invocando (4) y (5), reformulamos (6) y (7), reemplazando Sb(p Ley) por 17 
Gen r y Sb(q 2l, 2) por Sb(r z/,), respectivamente: 


—xB (17 Gen r) > Bew,£Sb(r Z¿.)) (6*) 


xB,(17 Gen r) > Bew, (Neg(Sb (r 2) (7%) 
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De este resultado inferiremos con Gódel que, si « es, como hemos su- 
puesto, una clase “recursiva” (-consistente, ninguno de los números 17 Gen 
r y Neg(17 Gen r) pertenece a Flg(x). Así se completa la demostración del 
Teorema VI. Ahora bien, 17 Gen r es el gódel de la fórmula que, según la 
nomenclatura adoptada, hay que llamar u,II(G(u,,fP0)). Así pues, el argu- 
mento presentado a continuación demostrará que, si la clase K de fórmulas 
es o-consistente, ni u,TI(G(u,,fP0)) ni —u,II(G(u,,fP0)) son deducibles de 
K. Si K= 4, la fórmula llamada u,II(G(u,,f”0)) no es demostrable ni refu- 
table en P. 

Si 17 Gen r perteneciera a Flg(x) tendríamos que hay un número n tal 


que n B, (17 Gen r). Por lo tanto, en virtud de (7%), Bew(Neg(Sb (r z)). 
Por otra parte, 17 Gen r e Flg(x) significa que hay una prueba desde K de 
la fórmula u,TI(G(u,,f”0)) y, por ende, también de la fórmula +[Sb(r zf,)] 
obtenida reemplazando en G(u,,f”0) la variable libre u, por f”0. Pero enton- 
ces tendríamos que Bew,.(Sb(r Zo), y k sería inconsistente y, por ende, (m- 
inconsistente. Por lo tanto, bajo las hipótesis del Teorema VI, 17 Gen r £ 
Flg(x). 

Supongamos, entonces, que Neg(17 Gen r) e Flg(x). Como 17 Gen r £ 
Flg(x), es claro que Van—=(n B, (17 Gen r)). En virtud de (6%), esto implica 


que VnBew,(Sb (r Zo): Flg(x) contendría a la vez el número Neg(17 Gen r) 


= +|-u TI(G(u,,fP0))] y el gódel de cada una de las fórmulas que se obtie- 
nen insertando en G(u,,f”0) —esto es t[r]— los numerales 0, f0, ff0,... 
en lugar de la variable libre u,. Pero entonces x sería w-inconsistente. Por lo 
tanto, bajo las hipótesis del Teorema VI, Neg(17 Gen r) £ Flg(x). 

Obsérvese que, si la clase k cumple las condiciones requeridas y le aña- 
dimos el número Neg(17 Gen r), la clase k' así formada es a la vez consis- 
tente y 0-inconsistente. k' es consistente, puesto que (17 Gen r) £ Flg(x) y, 
por cierto, si « y por ende Y son consistentes, 


(17 Gen r) ¿ Fle((Neg(7 Gen r)p). 


k' es (-inconsistente, por la razón aducida para probar que Neg(17 Gen r) 
£ Flg(x). Así queda probado, mediante un ejemplo, que la w-consistencia 
no equivale a la consistencia. 
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Gódel subraya que la demostración precedente es constructiva, pues todas 
las aseveraciones existenciales que contiene se basan en el Teorema V, el 
cual, “como fácilmente se ve, es inobjetable desde un punto de vista intui- 
cionista” (1931, p. 189, n. 45a). Por eso, Gúdel recibirá con incredulidad la 
noticia de que Wittgenstein cuestionaba su descubrimiento. En respuesta a 
una carta de Karl Menger con citas de Wittgenstein, le escribe el 53 de mayo 
de 1972: 


En lo que respecta a mi teorema sobre proposiciones indecidibles, los 
pasajes que usted cita? muestran claramente que Wittgenstein no lo en- 
tendió (o se hizo como que no lo entendía). Lo interpreta como una espe- 
cie de paradoja lógica, cuando en realidad es todo lo contrario, a saber, 
un teorema matemático perteneciente a una parte absolutamente incon- 
trovertida de las matemáticas: la aritmética finitista o análisis combina- 
torio. 

(Citado por Wang 1987, p. 49; cursiva mía) 


Gódel destaca asímismo que en la demostración del Teorema VI ha invo- 
cado solamente dos propiedades del cálculo P: (1) la clase de los axiomas y 
la relación “consecuencia inmediata?” —que epitomiza las reglas de infe- 
rencia— se pueden definir recursivamente (paso 4%), si “reemplazamos de 
algún modo los signos primitivos mediante números naturales” (paso 2"); (2) 
toda relación “recursiva” es P-decidible (paso 5%). “Por lo tanto, en todo sis- 
tema formal que satisfaga las condiciones (1) y (2) y sea o0-consistente hay 


32 Tomados de Wittgenstein 1956, pp. 50-54 y 176. No viene a cuento examinar aquí 


estos textos. Baste señalar que las dudas de Wittgenstein responden, en buena parte, al 
aserto de que la fórmula cuya indemostrabilidad e irrefutabilidad ha sido establecida 
por Gódel “habla” de sí misma y “dice” que es indemostrable. Este aserto, corriente en 
las exposiciones de la obra de Gódel, vale, obviamente, para la fórmula [R,;q] mencio- 
nada en el argumento informal presentado en la Sección 2.10.1 (y en el $1 de Gódel 
1931), pero no vale para la fórmula [17 Gen r] a que se refiere el Teorema VI. Esta 
fórmula “hablaría” de sí misma si contuviera el numeral correspondiente a 17 Gen r. 
Pero el único numeral cuya presencia se requiere en j[17 Gen r] es f”0, correspon- 
diente al número p = 17 Gen q % 17 Gen r. Con todo, importando ideas que no perte- 
necen ni contribuyen en nada al austero argumento combinatorio de Gódel, se puede 
justificar la “traducción” de la fórmula j[17 Gen r] mediante la oración castellana “la 
fórmula +[17 Gen r] no es demostrable”. 


sd En la acepción explicada en la p. 250, nota 4. Véase lo dicho en la p. 342. 
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proposiciones indecidibles* de la forma VxFx, donde F es una propiedad de 
números naturales definida recursivamente; y lo mismo ocurre en cualquier 
extensión de un sistema tal mediante una clase de axiomas recursivamente 
definible y o-consistente” (1931, p. 190s.). Gódel anota que tanto el sistema 
axlomático para la aritmética que consta de los axiomas de Peano, el esque- 
ma de definición recursiva PRS y “las reglas lógicas”, como los sistemas 
axiomáticos para la teoría de conjuntos de Zermelo-Fraenkel y de von 
Neumann cumplen las condiciones (1) y (2); y que “la condición (1) está 
satisfecha por cualquier sistema que tenga las reglas de inferencia habituales 
y cuyos axiomas se generen (como en P) por sustitución a partir de un nú- 
mero finito de esquemas” (1931, p. 191).*! 

El Teorema VI no significa, por cierto, que haya una propiedad de núme- 
ros, descriptible con los medios expresivos de P u otro sistema afín, tal que, 
para cierto número m no es verdadero ni falso que m la tenga. Tal como 
ocurre con otros teoremas matemáticos de imposibilidad, todo lo que el Teo- 
rema VI quiere decir es que cierta cuestión no puede resolverse con deter- 
minados recursos. Específicamente, si el sistema considerado es (-consis- 
tente (o siquiera consistente —Rosser 1936), siempre hay una propiedad así 
cuya posesión por cierto número no se puede demostrar ni refutar en el sis- 
tema. La imposibilidad comprobada por Gódel es comparable, por ejemplo, 
a la imposibilidad de construir con regla y compás un segmento recto igual 
a la circunferencia de un círculo de radio dado (el famoso problema de la 
“cuadratura del círculo”). Pero habrá de parecernos mucho más grave si cree- 
mos que P y los sistemas afines comprenden todos los recursos de que dis- 
pone el hombre para conocer con certeza una verdad sobre números no in- 
cluida ya en la aritmética finitista (Capítulo 2.6). 


Completaré esta sección enunciando ciertas consecuencias del Teorema VI 
que se demuestran en Gódel 1931, $3. Para ello, necesito una definición. 
Diré con Gódel que una relación (o clase) numérica es aritmética si se la 
puede definir mediante los conceptos de suma, multiplicación e identidad 
(confinados a los números naturales), utilizando negaciones, disyunciones y 


41 El Apéndice XVI contiene una caracterización general de los sistemas deductivos a los 


que se aplica una “forma abstracta” del Teorema VL 
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generalizaciones (sobre el dominio de los naturales). Una proposición arit- 
mética es una aseveración hecha con estos mismos recursos conceptuales. 
Gódel demuestra sin dificultad que toda relación “recursiva” es aritmética 
(Teorema VII). Esto implica que para todo problema de la forma VxFx — 
con F recursiva— existe un problema aritmético equivalente (esto es, un 
problema aritmético cuya solución determina si WxF'x es verdadera o falsa). 
Como la prueba del Teorema VI puede formalizarse en P, se sigue que cual- 
quiera de los sistemas formales a que se refiere el Teorema VI* contiene 
proposiciones aritméticas indemostrables e irrefutables en el sistema (Teore- 
ma VIID. Mediante un argumento interesantísimo que no puedo reproducir 
aquí, Gódel establece además que todo problema de la forma VxFx —con F 
recursiva— puede reducirse a la cuestión de si una cierta fórmula del cálcu- 
lo predicativo de primer orden es realizable (Teorema X). En otras palabras, 
para cada F recursiva hay una fórmula del cálculo predicativo de primer orden 
que es realizable si y sólo si VxFx es verdad. Esto implica que cualquiera de 
los sistemas formales a que se refiere el Teorema VI contiene fórmulas de 
primer orden (esto es, fórmulas sin variables ligadas de tipo superior a 1) 
que no pueden deducirse en el sistema, sin que, por otra parte, sea posible 
deducir la existencia de un contraejemplo (Teorema IX). Como Gódel (1930) 
había demostrado que toda fórmula válida del cálculo predicativo de primer 
orden es deducible en ese cálculo y por ende, a fortiori, en P o en una ex- 
tensión de P, las fórmulas a que se refiere el Teorema IX no pueden ser 
válidas; pero la realizabilidad de su negación es indemostrable en el sistema 
pertinente (P o una extensión (-consistente de P). Con el Teorema IX Gódel 
está al borde de establecer que el Entscheidungsproblem del cálculo predica- 
tivo de primer orden es insoluble (Teorema de Church). Mas para ello haría 
falta (1) extender a las relaciones recursivas en general lo que el Teorema V 
dice sobre las relaciones “recursivas” y (11) reconocer que toda función com- 


putable mediante un algoritmo es recursiva (Tesis de Church).* 
2 Gódel cita dos ejemplos de relaciones aritméticas: La relación diádica “x es mayor que 
y” definida por: x> y £€ Vz(y = x + z); y la relación triádica “x es congruente con y 
módulo rn”, definida por: x= y (mod n) O IX =yY + ZN VJY=X+ ZN). 

sl Vale decir, cualquier sistema deductivo con los signos, fórmulas y reglas de inferencia 


de P y una clase recursiva (-consistente de axiomas que incluya los axiomas de P. 


a Conforme a la Tesis de Church, si hubiera un algoritmo para determinar qué oraciones 


de primer orden son válidas, la clase de esas oraciones y su complemento, la clase de 
las oraciones de primer orden cuya negación es realizable, serían clases recursivas. Por 
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El “segundo teorema de incompletud” (Gódel 1931, Teorema XI) concier- 
ne directamente al programa de Hilbert. Simplificando, se lo puede resumir 
así: si el sistema P es consistente, la consistencia de P no puede demostrarse 
en P. Por eso, algunos escritores sensacionalistas han concluido que nunca 
podremos saber si la aritmética es o no contradictoria. Smullyan los ridicu- 
liza observando que “confiar en la consistencia de un sistema sobre la base 
de que éste puede probar su propia consistencia es tan estúpido como con- 
fiar en la veracidad de una persona porque ella dice que nunca miente” (1992, 
p. 109). Aunque justa, esta observación no disminuye la importancia 
metodológica del descubrimiento de Gúdel. El programa hilbertiano para pro- 
bar la consistencia de los axiomas de Peano no proponía deducir la consis- 
tencia de P en el mismo P (o en otro sistema afín que incluya esos axio- 
mas). Se trataba, más bien, de establecer dicha consistencia con recursos esen- 
cialmente más débiles. Hasta 1930 se pensaba que todos los recursos nece- 
sarios estaban contenidos en la aritmética finitista (Capítulo 2.6). Por otra 
parte, parecía claro que la aritmética finitista es representable y deducible en 
P. Por lo tanto, si la consistencia de P no se podía demostrar en P, tampoco 
se podría establecerla con los recursos de la aritmética finitista. 

El Teorema XI —al igual que el Teorema VI— se refiere no solamente a 
P sino a cualquier extensión de P mediante una clase recursiva de axiomas. 
Supondremos que K y D(K), k y Flg(x) son como en la explicación del paso 


lo tanto, según el Teorema V (extendido), habría en P una fórmula con una variable 
libre p(u), tal que Fp(n) si n es el gódel de cualquier oración de primer orden cuya 
negación es realizable. La prueba de p(n) sería una prueba en P de que la negación de 
la oración t[n] es realizable. Pero el Teorema IX enseña justamente que hay oraciones 
de esta clase que no admiten tal prueba. La extensión del Teorema V a las funciones 
recursivas se sigue inmediatamente de una observación expresada al final de Gódel 
1934 (p. 27). Pero durante la visita a Princeton en que dictó las lecciones que forman 
la base de este trabajo, Gódel no se avino a aceptar la Tesis de Church. Como indica 
en la “posdata” de 1964 (impresa a continuación de la observación citada), sólo llegó 
a convencerse a la luz de la obra de Turing (1936). El Teorema de Church sobre la 
insolubilidad del Entscheidungsproblem del cálculo de primer orden —publicado en 
Church 1936a— es un corolario de otro teorema más general, incluido en Church 1936 
(véase el Capítulo 2.11). 
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6” de la demostración del Teorema VI. K es consistente si y sólo si hay una 
fórmula de P que no pertenece a D(K). Esto equivale a la existencia de un 
número x tal que x es el gódel de una fórmula de P y no hay ningún número 
y que sea el gódel de una prueba de esa fórmula desde K. Usando las abre- 
viaturas introducidas en la demostración del Teorema VI (cf. Defs. 23 y 45), 
esta condición necesaria y suficiente para la consistencia de K se expresa 
así: IXVy(Form(x) A —(yB,x)). Abreviando aun más, escribo —como Gódel— 
“Wid(x)” en lugar de “IxVy(Form(x) A —(yB,x))” (no se pierda de vista que 
“Wid(x)” es aquí una expresión castellana abreviada). Supongamos ahora que 
kx es una clase “recursiva” de FÓRMULAS. Es claro que, siguiendo una por una 
las primeras 23 definiciones del paso 4” de la demostración del Teorema VI, 
es posible construir en P una fórmula F(u,), con una sola variable libre u,, 
que represente el predicado Form(x). Continuando hasta la Def. 45, y com- 
binándola con la definición de k como clase “recursiva”, se construye una 
fórmula B,(v,,u,) que representa la relación (yB,x). Entonces, la fila 


<u lv MF(u) a —B,(v;,41)) (8) 


es una oración de P que representa el aserto Wid(x): (8) “dice” en P que la 
clase “recursiva” k es consistente. Sea w el gódel de la oración (8).4 

El Teorema XI dice que, si k es una clase recursiva de FÓRMULAS, Wid(x) 
> —Bew,(w). Con menos abreviaturas —y referido al cálculo P y sus 
extensiones—, esto quiere decir que, si k es una clase recursiva que reúne 
los gódel de todas las fórmulas contenidas en una clase consistente K, no 
existe una prueba desde K de la fórmula (8). En particular, si k = Y, podemos 
leer P en vez de K. En tal caso, la fórmula (8) “dice” que P es consistente, 
y el Teorema XI asevera que esto es así sólo si (8) es indemostrable en P. 

Por cierto, la oración (8) = f[w] no es la única que representa en el cál- 
culo P la consistencia de la clase recursiva k. Supongamos que Wid*(x) es 
un enunciado —en castellano— equivalente a Wid(x) y que w* es el gódel 
de una oración que representa a Wid*(x) en P. A menos que se probara que 


45 Gódel (1931, p. 197) escribe: “Sei w die SATZFORMEL, durch welche in P Wid(x) 
ausgedriickt wird”; traducido: “Sea w la ORACIÓN mediante la cual Wid(x) se expresa 
en P”. Conforme a la convención sobre el uso de versalitas, esto quiere decir: “Sea w 
el gódel de la oración mediante la cual Wid(x) se expresa en P”. 
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(—+[w] v +[w*]) 2 D(K), el Teorema XI, en la forma en que ha sido enun- 
ciado no nos fuerza a concluir que Wid*(x) —> —Bew,(w*). Pero el argu- 
mento con que Gódel prueba el Teorema XI no depende específicamente de 
la estructura de (8). Antes bien, como enseguida veremos, suministra un 
esquema para probar que Wid*(x) —> —Bew,(w*), si Wid*(x) y w* son lo 
que dije. Por esta razón, la prueba del Teorema XI destruye toda esperanza 
de establecer la consistencia de P mediante un razonamiento formalizable en 
P, en que dicha consistencia se represente mediante una oración diferente de 
(8). 

El Teorema XI es simplemente una consecuencia del hecho de que el Teore- 
ma VI se puede probar formalmente en el cálculo P. Construir tal prueba es 
un trabajo largo y tedioso, que Gódel pospuso para la segunda parte de su 
artículo (que nunca llegó a escribir). En todo caso, la tarea mayor sería cons- 
truir las fórmulas de P correspondientes a las 45 funciones y relaciones 
recursivas definidas en el paso 4” de la demostración del Teorema VI, y es 
claro que esto es pura cuestión de paciencia: la definición semiformal de las 
respectivas abreviaturas indica la pauta a seguir. Una vez que se dispone de 
esas fórmulas no es difícil formalizar en P el argumento puramente combina- 
torio que lleva a la conclusión (9). Así, Hilbert y Bernays (1939) probaron 
rigurosamente en un sistema estrictamente más débil que P la oración que 
representa al Teorema VI en dicho sistema. 

Como se recordará, la etapa final de la prueba del Teorema VI consta de 
dos partes. Se muestra (1) que si k es consistente, 17 Gen r £ Flg(x) y (11) 
que si x es (0-consistente, Neg(17 Gen r) £ Flg(x). Con las abreviaturas que 
hemos estado usando, (1) puede escribirse: 


Wid(x) > Vi-(xB,(17 Gen r)) (9) 


Recordemos que 17 Gen r = Sh (p Zip), donde r = Sb(q Zo)» p=17 Gen q y 
q es el número que corresponde según el Teorema V a la relación “recursiva” 


diádica —xB,(Sb (y Ze)» abreviada Q(x,y). Reemplazando aquí y por p y 17 


Gen r en (9) por Sb(p Ly» comprobamos que (9) también puede escribirse: 


Wid(x) > Vx0(x,p) (10) 


2.10 Los Teoremas de Incompletud de Gódel 357 


Ahora bien, O(x,p) es una propiedad “recursiva” expresada en P según el 
Teorema V por la fórmula +[r], y +[17 Gen r] es precisamente la fórmula de 
P que consta de la variable +[17] seguida del signo II seguida de la fórmula 
f[r]. Es claro, entonces, que +[17 Gen r] “dice” en P que VxO(x,p), y que la 
oración 


=+[w] vw +[17 Gen rl] al) 


“dice” en P lo que (9) y (10) dicen en castellano. La versión formal de la 
prueba del Teorema VI en P incluirá, pues, una prueba de (11). Por lo tanto, 
si hubiera una prueba de +[w] desde K, habría también una prueba de +[17 
Gen r] desde K.** Ahora bien, según lo que se vio en la demostración del 
Teorema VI, tal prueba no puede existir a menos que K sea inconsistente. 
Por lo tanto, si K es consistente no puede haber una prueba de +[w] desde 
K. Usando abreviaturas: Wid(xk) —> —Bew,(w). Este es el Teorema XI. 
Evidentemente, el enunciado preciso de Wid(x) —esto es, IxVy(Formí(x) 
A —(yB,x))— no juega ningún papel en el argumento anterior. Dicho enun- 
ciado sirve tan sólo para fijar una fórmula de P —a saber, t[w]— que repre- 
sente la consistencia de P en P. En la prueba formal del Teorema VI en P 
tiene que figurar una fórmula así como antecedente de la implicación (11). 
Pero, a la luz del argumento con que establecimos la correspondiente impli- 
cación (9) en nuestra demostración del Teorema VI en castellano, es claro 
que —tal como adelanté— +[w] podría reemplazarse con cualquier fórmula 
t[w*] que represente en P un enunciado Wid*(x) equivalente a Wid(x).* 


ns Únase la prueba de (11) —que es una prueba desde y por ende, a fortiori, desde 


K— con la supuesta prueba de j[w] desde K y úsense estas dos fórmulas como premisas 
de una inferencia final por modus ponens. 
e Como ya he indicado, a los Teoremas VI y XI suele dárseles el nombre de primer y 
segundo “teorema de incompletud” de Gódel, designándoselos también mediante las 
abreviaturas Gl y G2, respectivamente. La opinión mayoritaria estima que G2 asestó 
un golpe de muerte al programa de Hilbert (sección 2.9.4). Ahora bien, G2 depende 
visiblemente de Gl y no presupone ninguna premisa adicional no admitida por Gódel 
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en la demostración de Gl. En vista de ello, no es descabellado decir que el escollo 
insalvable en que dicho programa naufraga es Gl; sobre todo si se tiene en cuenta 
que la cuestión de la consistencia de la matemática formalizada fue elegantemente 
reducida por Hilbert y los suyos al Entscheidungsproblem, y Gl establece precisa- 
mente que el Entscheidungsproblem es insoluble incluso en el caso de la aritmética. 
Por otra parte, G1 puede extenderse más allá de esos “sistemas afines” a Principia 
Mathematica considerados explícitamente por Gódel, a una clase de teorías formales 
a las que, por su misma construcción, no se aplica G2. Considérese la propuesta si- 
guiente. Los elementos de la teoría formalizada T se definen recursivamente como de 
costumbre. Sea II la definición recursiva de prueba en T (cf. Apéndice IX.F). Las 
listas finitas de fórmulas que cumplen con la condición II pueden ordenarse 
lexicográficamente, o por el tamaño del respectivo gódel. Añadimos a II esta estipu- 
lación suplementaria: una lista A de formulas de 7 que cumple la condición II es una 
prueba en T sólo si la última fórmula de A no es la negación de la última fórmula de 
ninguna prueba anterior a A en el orden adoptado. Evidentemente, es imposible deri- 
var una contradicción en T, y si T es suficientemente rica debiera ser posible derivar 
en T una oración que represente dicha imposibilidad y de este modo exprese la con- 
sistencia de 7. Michael Detlefsen (1986, 1990) sostiene que, no obstante los resulta- 
dos de Gódel, el programa de Hilbert podría todavía revivirse empleando tales méto- 
dos “atentos a la consistencia” (consistency-minded). Reconoce, sí, que “no estamos 
actualmente en la posición de resolver” la cuestión “muy difícil” de si ello permitirá 
cumplir dicho programa (1992a, p. 226). Pero pone especial cuidado en refutar a quie- 
nes, como Smorynski (1985) vinculan el alegado fracaso del programa de Hilbert di- 
rectamente con Gl, ya que este teorema ciertamente sería aplicable a la referida teoría 
T si ella es tan rica como sería necesario para que pruebe su propia consistencia. 


2.11 FUNCIONES COMPUTABLES 


Estudiaremos aquí las definiciones precisas de función numérica computable 
propuestas por Alonzo Church, Alan Turing y otros autores. Según lo conve- 
nido en el Capítulo 2.10, llamo función numérica a cualquier aplicación d: 
2) = N, tal que Y% < NY" para algún entero positivo r. Es oportuno recordar 
que cualquier función cuyo valor para un argumento dado pueda calcularse 
mediante un algoritmo es numérica en este sentido. Por ejemplo, el conoci- 
do algoritmo para calcular la raíz cuadrada de un entero positivo n hasta la 
q-ésima decimal lo que en efecto determina es el numerador —un entero — 
de la fracción con denominador 10% que menos dista de vn . Y para calcular 
la raíz cuadrada de un número real no entero tenemos primero que darnos 
una fracción decimal que lo represente con la aproximación requerida y lue- 
go aplicar el algoritmo al numerador de esta fracción. 

En el resto de este capítulo diré “función”, en vez de “función numérica”. 
Ocasionalmente convendrá distinguir entre funciones totales, cuyo dominio 
2 = NY para algún entero positivo r, y funciones parciales, cuyo dominio Y 
es una parte propia de N”. Distinguiré asímismo —al menos, de palabra— 
las funciones computables, que caen bajo los conceptos precisos propuestos 
por Church, Turing, etc. (ocurre que todos esos conceptos tienen la misma 
extensión), de las funciones calculables, cuyo valor para un argumento dado 
podría determinarse mediante un algoritmo, conocido o no. Generalmente se 
admite que toda función computable es calculable en principio, pues los 
métodos de definición contemplados, aunque pueden ser mucho más com- 
plejos que ningún algoritmo tradicional, son siempre combinaciones finitas 
de procedimientos elementales y cuando alguien nos los explica los recono- 
cemos como algoritmos en el sentido intuitivo ordinario del término.' Por 


En un artículo reciente, Edward Nelson cuestiona la idea de calculabilidad en principio 
contenida en el “el dogma finitista [de] que toda función recursiva es efectivamente 
calculable” (1993, p. 9). Además de un argumento matemático, dependiente de su 
Predicative Arithmetic (1986), propone la siguiente analogía: 
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otra parte, la Tesis de Church afirma que toda función calculable es compu- 
table. Trataremos de esclarecer la naturaleza de este aserto: ¿se trata, como 
sugiere su nombre, de una conjetura matemática que aún no ha sido demos- 
trada (ni refutada)? ¿o de una convención sobre el uso del lenguaje? ¿o de 
un enunciado de otra índole? 

En las primeras tres secciones de este capítulo consideraré sucesivamen- 
te: el concepto general de función recursiva que Gódel propuso en 1934 si- 
guiendo una sugerencia de Herbrand, y su notable simplificación por Kleene 
(Sección 2.11.1); el concepto de función A-definible propuesto por Church 
en 1935 (Church 1936), la Tesis de Church según la cual este concepto co- 
incide con el concepto intuitivo ordinario de función calculable, y el Teore- 
ma de Church, que da —bajo este supuesto— una solución negativa al Ent- 
scheidungsproblem del cálculo predicativo de primer orden (Sección 2.11.2); 
y la concepción de Turing (1936) de un tipo de “máquinas” que incorporan 
todos los ingredientes del calcular humano y la definición de computabilidad 
basada en ella (Sección 2.11.3.). Luego, daré ejemplos y diagramas de má- 
quinas de Turing (Sección 2.11.4), que utilizaré enseguida para demostrar 
algunos resultados importantes al respecto y, basándome en ellos, el Teore- 
ma de Church (Sección 2.11.5). 


Los finitistas han verificado [que toda función computable es calculable] en casos 
sencillos. En otros casos pueden darse por vencidos, pero saben que el cálculo se 
completaría con sólo persistir lo suficiente. Si les preguntan cuánto es suficiente, 
su respuesta sería: aproximadamente un número de operaciones igual al numeral 
que estoy calculando. 

Los niños malcriados tienen berrinches. Han comprobado en casos sencillos 
que esto les procura lo que quieren. En otros casos, pueden darse por vencidos, 
pero saben que conseguirían lo que quieren con sólo persistir lo suficiente. Si les 
preguntan cuánto es suficiente, su respuesta sería: hasta que consiga lo que quie- 
ro. 

Con esto no busco desacreditar a quienes sustentan opiniones diferentes de la 
mía; simplemente expreso mi opinión de que el finitismo es un sistema autovali- 
dante de creencias que no tiene ninguna base y podría muy bien ser incorrecto. 

(Nelson 1993, p. 10) 


Nelson no pone en duda la Tesis de Church tal como la enuncio en el texto: toda fun- 
ción efectivamente calculable es computable (recursiva). 
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En 1934 Gódel dictó en el Institute for Advanced Study de Princeton una 
serie de lecciones sobre “Proposiciones indecidibles en sistemas matemáti- 
cos formales”. Los apuntes de Kleene y Rosser, repartidos a la sazón a un 
grupo de subscriptores, luego fueron publicados por Davis (1965) con notas 
y correcciones de Gúdel y una importante “Posdata”, fechada el 3 de junio 
de 1964.? En la mayor parte de este escrito Gódel utiliza un concepto de 
función “recursiva” ligeramente más amplio que en 1931; el nuevo concepto 
coincide exactamente con lo que en la Sección 2.10.2 llamé funciones 
recursivas primitivas O pr-recursivas. Entre las funciones básicas a partir de 
las cuales toda función “recursiva” puede definirse (aplicando los esquemas 
PR4 y PRS de la Sección 2.10.2) se cuentan ahora, no sólo la función suce- 
sor y la función cero (definidas por PR1 y PR2), sino también, para cada 
entero positivo r, la k-ésima proyección de N" en N (1 < k < r), esto es, la 
función (X,, . .. ,x,) > x, (PR3). Luego, en el $9 y final, Gódel advierte que 
la función $: N? —= N, definida a continuación a partir de dos funciones 
“recursivas” dadas y y y, en general no es “recursiva” en el sentido es- 
pecificado por las condiciones PR1-PRS5 (vale decir, no es pr-recursiva): 


01,0) =w(y) 
0(+1,0)=x(%) 
00+1,y+1)=0(,00+l y) 


La definición precedente enseña a calcular la función y mediante un proce- 
dimiento de recursión simultánea con respecto a dos variables. En una nota 
añadida en 1964, Gódel recuerda que Ackermann (1928) construyó una fun- 
ción calculable por recursión con respecto a una sola variable y demostró 
que ella crece más rápido que cualquier función pr-recursiva y, por lo tanto, 
no puede ser pr-recursiva ella misma.* 


2 El texto impreso en Davis 1965 figura ahora también en Gódel, CW, I, 346-371, y en 
traducción castellana en OC, pp. 167-98. Las notas y correcciones con que Gódel su- 
plementó los apuntes en 1934 están incorporadas al texto; las observaciones añadidas 
en 1964 van entre corchetes. 


Ackermamn (1928) introduce una jerarquía de funciones con valores en N. Una fun- 
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Gódel se pregunta si no sería posible definir un concepto de función recur- 
siva que abarque todas las formas de recursión imaginables. Enuncia ense- 
guida la definición siguiente, “sugerida por Herbrand en una comunicación 
privada”: 


Si q denota una función desconocida y Y;,..., Y, son funciones cono- 
cidas, y las y y q se toman libremente, del modo más general, las unas 
como argumento de las otras, y de entre las expresiones resultantes igua- 
lamos ciertos pares (if the w”s and q are substituted in one another in the 
most general fashions and certain pairs of the resulting expressions are 
equated), entonces, si el sistema resultante de ecuaciones funcionales tie- 
ne una y sólo una solución para q, y es una función recursiva. 


ción es de tipo 1 si sus argumentos son k-tuplos de números naturales (k > 1); de tipo 
2, si sus argumentos incluyen funciones de tipo 1; de tipo n+1, si sus argumentos in- 
cluyen funciones de tipo n. Propone el siguiente ejemplo de una función de tipo 2, que 
utiliza luego para definir la llamada función de Ackermann: 


páf(c),x,0) = x 
p fo), xon) = fp (fc) x.m)) 


donde f es cualquier función de tipo 1 y on designa el siguiente de n. Ackermann 
advierte que el subíndice c indica que p (f(c),x,y) depende de f, x e y, pero no depen- 
de de c. Como fácilmente se comprueba, p.(f(c),a,n) es igual al valor de f aplicada 
iterativamente n veces al argumento a. Ackermann introduce además la función auxi- 
liar binaria a., definida por a(x,0) = 0, a(x,1) = 1, aL(x,n+2) = x. Con estos recursos 
define la función ternaria (p mediante las ecuaciones: 


tc,y.0) = x+y 
p(x,y,0n) = p.(Q(x,c,n),04x,1),y) 


El lector debe comprobar que p(x,y,1) = xy y ((x,y,2) = x”. p(x,y,3) es el resultado de 
repetir y veces, partiendo del argumento x, la operación de elevar al exponente x; p(x,y,4) 
es el resultado de repetir y veces, partiendo del argumento x, la operación de elevar al 
exponente p(x,y,3), etc. La función de Ackermann es la función unaria y definida, para 
cada x e Ni, por la condición: 


y) = p(x,x,x) 


Ackermann demostró que y(n) crece con n más rápidamente que cualquier función de 
tipo 1. Como todas las funciones pr-recursivas son de tipo 1, y no puede ser pr-recursiva. 
Por otra parte, obviamente, y es una función calculable. 
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Por ejemplo, podríamos tener 


01.0) = Y /(x) 

90,y+1) = YW20) 

0d, y+1) = Y30) 
00+2,y+1) = Y4(00,y+2),0(x,0(%,y +2) 


(Gódel, CW, L, 368; OC, pp. 194s.) 


Aunque Gódel no lo diga, debemos dar por supuesto que las funciones pr- 
recursivas básicas —sucesor (PR1), cero (PR2) y las proyecciones (PR3)— 
cuentan en todo caso como funciones conocidas (en el ejemplo se utiliza 
visiblemente la función sucesor, además de las y). Gódel adopta la defini- 
ción anterior con dos importantes restricciones.* Requiere (i) que el lado 
izquierdo de cada ecuación funcional del sistema que determina la función 
r-aria q tenga la forma 


A A A TES E A E A 


y (ii) que para cada r-tuplo (k,,....,k,) e N' haya un y sólo un me N tal 
que la ecuación q(k;,... ,k,) = m pueda derivarse del sistema en virtud de 
las reglas de derivación que Gúdel prescribe. La restricción (1) parece desti- 
nada sólo a facilitar el enunciado de estas reglas, pues la exigencia de que 
todas las funciones y;, tomen n-tuplos como argumentos puede trivialmente 
cumplirse así: elíjase n de modo que las funciones conocidas que van a uti- 


Kalmár (1955) construyó una función que satisface la definición atribuida por Gódel a 
Herbrand, mas no las restricciones añadidas por Gódel. Véase Hermes 1961, 821.7. 
No hay un algoritmo que permita calcular efectivamente la función de Kalmár. En re- 
lación con esto, conviene recordar que, como señalé en la Sección 2.6.3, Herbrand (1931) 
imponía el requisito siguiente a todas las funciones admisibles en su aritmética formal: 
“consideradas intuicionistamente” —esto es, “traducidas al lenguaje ordinario, como 
propiedades de enteros, y no como puros símbolos” — “permiten hacer efectivamente 
el cálculo” del valor que asignan a cada “sistema particular de números” (esto es, a 
cada n-tuplo, cuando la función considerada es n-aria). En vista de esto, me parece que 
el hallazgo de Kalmár indica que Gódel impuso, con certero instinto, a la definición de 
función recursiva que Herbrand le había propuesto precisamente las restricciones in- 
dispensables para ajustarla al propósito —y a las convicciones— del propio Herbrand. 
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lizarse para determinar a y sean a lo sumo n-arias; entonces, si entre ellas 
hay una función m-aria yw (m < n), reemplácesela con la función n-aria y' 
definida por yw(X;,... Xy e X,) = Y(GX¡, ... ,X,,). Las reglas de deri- 
vación se definen inductivamente así: 


A +1 yo 


(a) Cualquier expresión obtenida al reemplazar por números naturales 
todas las variables de una de las ecuaciones del sistema es una 
ecuación derivada. 

(1h) Si y; es una de las funciones conocidas que figuran en el sistema, 
(K;, ... ,k,) es un n-tuplo de números naturales y m es un número 
natural tal que y;(k,,... k,) es igual a m, entonces y;(K;, . . . ,k,) 
= m es una ecuación derivada. 

(Qa) Si Yi (ki, . ..,k,) = m es una ecuación derivada, entonces la ecua- 
ción obtenida al reemplazar y;(k,,.... ,k,) por m en cualquiera de 
los lugares en que la expresión y;(Kk;, ... ,k,) figura en una ecua- 
ción derivada es asimismo una ecuación derivada. 

(Qb) Si p(k;,....k,) = m es una ecuación derivada, donde k,,...., k, y 
m son números naturales, la expresión obtenida al reemplazar 
Q(k;,... ,k,) por m en una posición ocupada por q(k;,... ,k,) en el 
lado derecho de una ecuación derivada es asimismo una ecuación 
derivada. 


Combinada con las reglas de derivación, la restricción (11) equivale a la condi- 
ción siguiente: (11%) los r-tuplos (K,, . . . ,k,) que son los argumentos posibles 
de y pueden ordenarse de tal modo que para computar el valor de q co- 
rrespondiente a cierto r-tuplo (k;, .... ,k,) sea preciso conocer, a lo sumo, los 
valores de q correspondientes a r-tuplos que preceden a(k;,... ,k,) en dicho 
orden. 

Llamamos función recursiva general a toda función numérica que satisfa- 
ga estos criterios de Gódel (1934). En la literatura se ha solido llamarlas 
funciones recursivas “en el sentido de Herbrand-Gódel”. Adviértase que, en 
virtud de la restricción (11), las funciones recursivas generales son funciones 
totales. Esta fue históricamente la primera de las nociones equivalentes de 
función computable a que aludí arriba. Es obvio que toda función recursiva 
general es calculable mediante un algoritmo. Gódel se preguntó, a la inver- 
sa, si las funciones calculables son todas recursivas, pero no aventuró una 
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respuesta positiva a esta pregunta (cf. Church 1936, p. 336, n. 18). Años 
más tarde, en la “Posdata” de 1964 a las lecciones de 1934, Gódel declara 
que Turing (1936) fue el primero que dio un análisis satisfactorio de “proce- 
dimiento mecánico” (“alias “algoritmo” o “procedimiento de cómputo” o “pro- 
cedimiento combinatorio finito””—Gódel, CW, LI, 369; OC, p. 196). Basán- 
dose en ese análisis, Turing construyó su definición precisa de función com- 
putable que tiene, demostrablemente, la misma extensión que el concepto de 
función recursiva general. En vista de esto, Gódel acabó aceptando que to- 
das las funciones calculables son recursivas en el sentido definido por él en 
1934. 

Gracias a un hallazgo de Stephen C. Kleene (1936) se puede dar una carac- 
terización de las funciones recursivas generales mucho más perspicua y ele- 
gante que la original de Gódel. Kleene demostró que basta suplementar las 
operaciones PR4 y PR3 con una sencilla operación adicional para generar 
todas las funciones recursivas generales a partir de las funciones pr-recursivas 
básicas (PR1-PR3). Se trata de la operación de buscar, partiendo de O, el 
número natural más pequeño que cumple una condición pr-recursiva dada 
(esto es, que posee una propiedad dada cuya función característica sea pr- 
recursiva). En la p. 334 (++), vimos que Gódel (1931) utilizó esta operación 
restringida a un segmento de ÑN acotado por arriba para definir un tipo de 
funciones pr-recursivas que luego figuran en la construcción del predicado 
pr-recursivo Bw(x) (éx es el gódel de una prueba”). Gódel demostró que si q 
es una función pr-recursiva n-aria y R es una relación pr-recursiva (m+1)- 
aria, también es pr-recursiva la función que asigna a cada (n+m)-tuplo 
(Mis +++ Mn) ps + +» Y) el más pequeño número x < p(x;,... ,x,) que cumple 
la condición R(y,,... ,y,»x), O el número O si no hay un x < Q(x;,... Xx, 
que la cumpla. Con el simbolismo utilizado en la p. 334, el valor de esta 
función en el argumento (X,, . +. Xy) q) - + - Jn) Se llama ux(x < Q(%,, ... 14) 
ARO +++ Y» 0)). Kleene se interesa por la operación de búsqueda simboli- 
zada con u, cuando no está restringida por una cota superior o tope. Su- 
pongamos, pues, que hay por lo menos un número que cumple la condición 
RO ++ - Y x) y sea ux(RQy¡) . - - Y x)) el número más pequeño que la cum- 
ple. Si y, es la función característica de la relación R, este número se desig- 
na asimismo con la expresión ux(xp(y¡, - -. Y, x) = 0). Kleene (1943, p. 45) 
muestra que si x es una función recursiva general, la función (y;,... ,J) 
> UXARO ¡> > - + YX) = 0) también es recursiva general. Para ello, introdu- 
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ce una función auxiliar que llamaré y, definida por las ecuaciones 


YW(OJY «Y pp) = Xx (1) 
YWE+HLY Y ) = WORO 1 + Y AE DY > ++ Y A EL) (2) 


y luego define la función b:(y¡,... Y) > HXOURO 1> > - > Y 1) = 0) median- 
te la ecuación 


$0, E ia) = VORO 1 Ue Im 0)Y 1 AS Jm 0) (3) 


Esta ecuación define a q en la forma requerida por Gódel, en términos de 
las dos funciones “conocidas” y y Xp. Para ver que q realmente es la fun- 
ción que he dicho, considérese un m-tuplo cualquiera q = (q,, ... q). Cal- 
culemos el valor de (q) mediante reemplazos en la ecuación (3). Primero 
reemplazamos Y p(q,0) por su valor. Si es igual a O, la ecuación (1) nos da la 
respuesta buscada: Q(q) = y(0,q,0) = 0. Si xg(q,0) = 1, tenemos que (q) = 
y(1,9,0) = v(xp(q,1),q,1), por la ecuación (2). En la última expresión, reem- 
plazamos Y g(q,1) por su valor. Si es igual a O, la ecuación (1) nos dice que 
d(q) = 1. En cambio, si xp(q,1) = 1, tenemos que (q) = w(l,q,1) = 
W(Xr(9,2),q,2), por la ecuación (2). El proceso se repite hasta encontrar un 
número p tal que y a(q.p) = 0. (Como se recordará, hemos supuesto que hay 
por lo menos un número tal). En virtud de la ecuación (1), es claro que (q) 
= p. Porque los números se consideran consecutivamente, de menor a ma- 
yor, a partir de O, es claro que el primer número p que cumpla la condición 
Xr(q.p) = O es también el más pequeño que la cumple. De modo que (q) = 
p = Ux(xg(q,x) = 0). 

Kleene (1936) demostró el siguiente teorema: Si y es una función recursiva 
general r-aria, entonces, para cada r-tuplo (x;,....,x,) € N', 


Y(Xp ++ Xx) = W(Uy OLX), 1,,y) = 0) 


donde y es una función pr-recursiva r-aria y y es una función pr-recursiva 
(r+1)-aria tal que la ecuación x(x;,... ,x,,y) = 0 tiene por lo menos una solu- 
ción y e Ni, para cada r-tuplo (x;,....,x,) e N'. La demostración de este 
teorema no es demasiado difícil, pero toma tiempo, y no puedo darla aquí.* 


3 Recomiendo la demostración de Hermes 1961, $21 (hay traducción inglesa). 
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En virtud del mismo, toda función recursiva general puede expresarse como 


una función compuesta —en el orden indicado— de dos funciones pr- 


recursivas y una aplicación del operador 1. Como toda función pr-recursiva 


es evidentemente recursiva general, este hallazgo de Kleene nos permite re- 


emplazar la definición gódeliana de función recursiva general por las seis 
estipulaciones siguientes: 


Rl 
R2 


R3 


R4 


R5 


R6 


La función sucesor x+> x + l es recursiva general. 


Si r es un entero positivo, la función cero (x;,....,x,) > 0 es 
recursiva general. 
Si r es un entero positivo, la función (x;,... Xx, >x, (1 <k:<r) 


es recursiva general. Esta función se llama la k-ésima proyección 
de N, simbolizada rn”, o simplemente T,.* 

Si h es una función recursiva general m-aria, y g;,... g,, son fun- 
ciones recursivas generales n-arias, también es recursiva general la 
función compuesta: 


A A E Y A A 4) 


Si g es una función recursiva general (n—1)-aria (una constante, si n 
= 1) y h es una función recursiva general (n+1)-aria, también es 
recursiva general la función n-aria f definida por la doble condición 
siguiente: 


FO,Xo) «+ Xp) = EUtzo > + - Xp) 
fot, 1) = MA ARA» ++ Xd) +++ Xp) 


Si h es una función recursiva general (r+1)-aria (r > 1) y para cada 
r-tuplo (x;,...,x,) e N' hay un ye Ñ tal que h(x;,,....,x,,y) =0, 
también es recursiva general la función r-aria g definida por la con- 
dición siguiente: 


Ep, ...,X,.) = UHYUAX 1, +. Xy) = 0) 


Como indiqué en la p. 332, nota 18, una notación rigurosa debería incluir el valor de 
r en el símbolo de la proyección. En la práctica, este dato se omite porque normalmen- 
te está implícito en el contexto. 
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La condición R6 exige que la ecuación h(x;,....x,,y) = O tenga por lo 
menos una solución y para cada r-tuplo (x;, . . . ,x,). Este requisito es indispen- 
sable para que la función g cumpla el requisito (11) prescrito por Gódel en su 
definición de las funciones recursivas generales, esto es, para que, dado un 
r-tuplo (k;,... ,k,) e N" haya un y sólo un me N tal que g(k,,.... k,) =.m. 
Pero, visiblemente, se trata de una exigencia muy artificial. Si la elimina- 
mos, obtenemos el concepto de función recursiva parcial, introducido por 
Kleene (1938), el cual constituye nuestra noción más amplia de función recur- 
siva. Kleene (1943) lo define así: 


Una función q(x;,... ,x,) es recursiva parcial si existe un sistema E de 
ecuaciones que la define recursivamente en el sentido que se explica a 
continuación. Un sistema E de ecuaciones define recursivamente una fun- 
ción recursiva parcial n-aria si, para cada n-tuplo (x,,... ,x,) de números 
naturales se puede derivar de E, conforme a las reglas [de derivación], a 
lo sumo para un numeral x una ecuación de la forma f(X,,... Xp) =X, 
donde Xi, ... ,X, son los numerales que representan a los números natura- 
les x,, ... ,x, La función n-aria definida por E en este caso es la función 
Q cuyo valor b(x;,...,x,) para el argumento (x,,... x,) es el número 
natural x representado por el numeral X si ese numeral existe, y de otro 
modo está indefinido.” 


En virtud de esta definición, toda función recursiva general es recursiva par- 
cial. Por eso, en vez de “función recursiva parcial”, se suele decir simple- 
mente función recursiva. 


Construí la definición arriba transcrita haciendo los reemplazos indicados por Kleene 
(1943, p. 50s.) en su definición gódeliana de función recursiva general (1943, pp. 44s.). 
En vez de “las reglas [de derivación]”, Kleene dice “las reglas R1 y R2”, con lo cual 
alude, no por cierto a nuestras reglas R1 y R2, sino a su propia versión (p. 43) de las 
reglas de derivación de Gódel. 
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2.11.2 La Tesis y el Teorema de Church 


El primero en reclamar que toda función efectivamente calculable es una 
función recursiva general fue Alonzo Church (1936). En este trabajo —un 
resumen de cuyos resultados se publicó en 1935— Church se propone dar 
“una definición de calculabilidad efectiva que corresponda satisfactoriamen- 
te a la noción intuitiva un tanto vaga” (p. 346) que solía invocarse en la 
literatura matemática. Se vale para ello del concepto de función A-definible 
—desarrollado por él y Kleene— cuya extensión demostrablemente coincide 
con la del concepto gódeliano de función recursiva general. 

El concepto de función A-definible se introduce en términos de un siste- 
ma formal extraordinariamente simple, que llamaré el A-cálculo. Los símbo- 
los del formalismo son el operador A, los tres pares de paréntesis (, ), [, ], £, 
$, y una lista infinita de variables, que identifico con X, X;, Xp - - . , aUnque, 
siguiendo a Church, las llamaré a, b, c,... Una fórmula es cualquier se- 
cuencia finita de símbolos. Usaré, como Church, caracteres en negrita como 
variables metalingiísticas que representan fórmulas. (Por lo tanto, en la pre- 
sente sección, una letra en negrita no representa un n-tuplo). Los conceptos 
de fórmula bien formada (fbf), variable libre y variable ligada se definen 
inductivamente como sigue. (1) Si x es una variable, x es una fbf y la varia- 
ble x está libre en la posición que ocupa en esa fbf. (11) Si F y X son fbfs, 
(0 es una fbf; si la variable x está libre (ligada) en cierta posición que 
ocupa en F' o X, también está libre (ligada) en la posición correspondiente 
en (FOO. (111) si M es una fbf y x es una variable libre en M, Ax[M] es una 
fbf, x está ligada en todas las posiciones que ocupa en Ax[M] y cualquier 
variable z + x que esté libre (ligada) en M también está libre (ligada) en la 
posición correspondiente en Ax[M]. 

Church introduce varias abreviaturas: si F' consiste en (o se representa me- 
diante) un solo signo, escribe F(X) en vez de (FGD, F(X,Y) en vez de 
EEFFOOHO), etc.; en vez de AX,[AX)[ ...Ax,[M] ... ]] escribe AX,x, . . . Xx, M 
o, si M no empieza con una variable, simplemente Ax,x, ... x,M. Luego dis- 
tingue una secuencia de fbfs construidas según un procedimiento uniforme, 
a las que designa abreviadamente con números, que indican el respectivo 
lugar en la secuencia. Según esto, 


2.11 Funciones computables 370 


0 abrevia a ab: a(b) 
1 abrevia a 2ab-ala(b)) 
2 abrevia a ab alalaíb))) 


y así sucesivamente.? A estas fbfs las llamaré numerales. Si F, G y H son 
fórmulas, designo con S*¿HI la fórmula que resulta al reemplazar F por G 
en todas las posiciones que F' ocupa en H. 

Hay tres reglas para derivar una fbf F de una dada fbf G. Si M y N son 
fórmulas y x y z son variables, la fórmula derivada F' puede ser: 


I La fbf resultante al reemplazar en G una parte Ax[M] por 1z[S*,MI], 
donde z es una variable que no figura en M. 
TI La fbf resultante al reemplazar en G una parte (Ax[M]HW) por 


S*yMI, siempre que las variables ligadas en M difieran de x y de 
todas las variables libres en N. 

rr La fbf resultante al reemplazar en G una parte S*,MI (no precedida 
inmediatamente por 4) por (Ax[M]H(W), siempre que las variables 
ligadas en M difieran de x y de todas las variables libres en N. 


Si G es una fbf y F=G, o F se deriva de G según una de estas tres 
reglas, decimos que G es inmediatamente convertible en F, simbólicamente 
G > F? G es convertible en F —abreviado G conv F— si G => Fo si hay 
una fbf H tal que G conv H y H => F. Si G conv F, hay pues una secuencia 
finita de fbfs G >H, >H,= ...=>M, => F, en la que cada fbf (excepto 
la última) es inmediatamente convertible en la siguiente en virtud de alguna 
de las reglas I-II. Tal secuencia es una conversión. Llamo sustitución de 
variables a una conversión que sólo incluye aplicaciones de la regla I. Lla- 


mo, con Church, reducción a una conversión que combina aplicaciones de la 
regla I con una aplicación única de la regla II (pero no aplica la regla IID. 


8 Formalmente (sin abreviaturas) O es la fbf Ax[Ax[£xH)]], 1 es Ax LOSA Ay! 2 
es AMA LESS RO ))]], etc. Adviértase que en vez de O, 1 y 2, Church escribe 1, 
2 y 3, respectivamente, porque en todo su artículo identifica los números naturales con 
los enteros positivos (cuenta desde uno, y no como nosotros desde cero). Por la misma 
razón, Church estipula que la función característica de un conjunto C asigna el valor 2 
a los elementos de C (y el valor 1 a los objetos que no pertenecen a C). 


Church no emplea este simbolismo. 


2.11 Funciones computables 371 


Una función y:N —= N es A-definible si hay en el A-cálculo una fbf F tal 
que, si p(m) = r, y m y r son los numerales que, según la convención adop- 
tada, designamos con los números m y r, respectivamente, entonces, (¿FYy(n) 
conv r. Esta definición se extiende sin dificultad a funciones cuyo dominio 
es una potencia cartesiana de N. Generalmente, y:N% —= N es A-definible si 


hay en el A-cálculo una fbf F tal que, si p(M,,...,M,) ="F, Y My... ,M,,T 
son los numerales que designamos con los números m,,... , My Y, respecti- 
vamente, entonces, (Fj(m,, ...,m,) conv r.'% 


Antes de seguir adelante, defino dos conceptos auxiliares que utilizare- 
mos luego. Una fbf está en forma normal si no contiene ninguna parte de la 
forma (AJ[MIHQAV). Si la fbf F está en forma normal, cualquier fbf que sea 
parte de F está en forma normal. Decimos que una fbf F tiene la forma normal 
G si F conv G y G está en forma normal. Una fbf puede tener varias formas 
normales, pero todas ellas son mutuamente convertibles por sustitución de 
variables. Church indica un modo de distinguir, entre las varias formas nor- 
males de una fbf dada, una forma normal principal única, determinada por 
la selección de las variables que figuran en ella y el orden en que aparecen. 
La forma normal principal se define de tal modo que todo numeral es una 
forma normal principal. Church destaca que “en el caso de cualquier fun- 
ción A-definible de enteros positivos,'! el proceso de reducción de fórmulas 
a la forma normal provee un algoritmo para calcular efectivamente los valo- 
res particulares de la función” (p. 349). 

Después de presentar el A-cálculo, Church da reglas para asignar un nú- 
mero de identidad —un gódel— a sus símbolos y fórmulas. Luego define lo 
que llama funciones recursivas en términos que difieren apenas —e inesen- 
cialmente— de la definición gódeliana de función recursiva general presen- 
tada en la Sección 2.11.1. En este contexto, introduce la noción de conjunto 
recursivamente enumerable, que ha llegado a ocupar una posición central en 
la teoría de las funciones recursivas (o computables). Hoy día decimos que 
un conjunto C < Nes recursivamente enumerable si y sólo si C es el domi- 
nio de una función recursiva parcial (en el sentido explicado al final de la p. 


10 Recuérdese que (Fj(m,,... m,) es una abreviatura. Por ejemplo, (FH(m,,m>,,m3) es pro- 


piamente la fbf (((FHm,)Hm,) m3). 


1 La restricción a “enteros positivos” se explicó en la nota 8. 
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368). Un conjunto cualquiera es recursivamente enumerable si sus miembros 
tienen números de identidad y el conjunto de estos números es recursivamente 
enumerable. Estas definiciones son claras y simples, pero no dejan ver in- 
mediatamente por qué dichos conjuntos se llaman de ese modo. En el escri- 
to de Church, el concepto aparece bajo otra perspectiva. Una secuencia infi- 
nita de objetos cualesquiera, a, 4,, 4,, ... puede verse como una aplicación 
con dominio N que asigna a cada número n el n-ésimo término de la se- 
cuencia. Supongamos ahora que cada término a, tiene un número de identi- 


dad *a,.. Diremos, con Church, que la secuencia ay, 4, d,, ... es recursiva 
si la función n > %a, es recursiva. El conjunto (xl(Gn e Nx = a,)) es 
recursivamente enumerable si la secuencia ap, a;, d,,... es recursiva.!? 


Obviamente, la función recursiva n > %a, enumera el conjunto descrito. Para 
pasar de esta definición a la que formulé primero basta considerar lo siguiente: 
(1) si f es una función recursiva total, sus valores, £(0), £(1), FC), ... for- 
man una secuencia recursiva, de modo que el alcance de f, esto es, el con- 
junto (xlEn € Nx = f(m)y es un conjunto recursivamente enumerable, se- 
gún nuestra segunda definición; (11) si f es una función recursiva total y g es 
la función definida en el alcance de f por la condición g(x) = uy(fO) = x), 
e indefinida fuera del alcance de f, se puede probar que g es una función 
recursiva parcial; (111) si g es una función recursiva parcial, se puede probar 
que existe una función recursiva total f cuyo alcance es el dominio de g. En 
virtud de (11) y (111) es claro que un conjunto numérico es el dominio de una 
función recursiva parcial sí y sólo si es el alcance de una función recursiva 
total. Por lo tanto, las dos definiciones de conjunto recursivamente enumera- 
ble son equivalentes. 

Church enuncia sin demostración una lista de doce teoremas que culmina 
con estos dos:!* 


2 La definición original de Church se aplica sólo a conjuntos de fbfs: “Un conjunto de 
fórmulas bien formadas se dice recursivamente enumerable si hay una secuencia 
recursiva infinita que consta exclusivamente de fórmulas del conjunto y contiene cada 
fórmula del conjunto por lo menos una vez” (1936, p. 96). Pero la generalización que 
di arriba es enteramente natural. 


Church indica que el Teorema XVI fue demostrado por Kleene, e independientemente, 
en una forma ligeramente distinta, por Rosser, y que el Teorema XVII fue demostrado 
independientemente por Kleene y el propio Church, más o menos al mismo tiempo. 
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TEOREMA XVI. Toda función recursiva es A-definible. 
TeoreEMA XVII. Toda función A-definible es recursiva. 


Llegado a este punto, Church está listo para dar la definición de calculabili- 
dad efectiva anunciada al comienzo. 


Ahora definimos la noción, ya comentada, de una función efectivamente 
calculable de enteros positivos identificándola con la noción de una fun- 
ción recursiva de enteros positivos (o de una función A-definible de en- 
teros positivos). Pensamos que esta definición se justifica por las siguientes 
consideraciones, en la medida en que sea posible obtener una justifica- 
ción positiva para la elección de una definición formal correspondiente a 
una noción intuitiva. 

(Church 1936, p. 356) 


Junto con anunciar esta definición, Church anotó que ella está respaldada 
por el hecho de que los conceptos de función recursiva y de función A-defi- 
nible, de construcción tan diversa, tienen la misma extensión;'* pero aquí 
aduce otras razones. Por una parte, recuerda que (como señaló en el pasaje 
que cité en la p. 371) cada función A-definible tiene un algoritmo para cal- 
cular sus valores. Por otra parte, arguye que toda función calculable median- 
te un algoritmo tiene que ser A-definible. Por ejemplo, si una función unaria 
F es calculable mediante un algoritmo, tiene que haber en alguna notación, 


para cada n e Ni, una serie finita de expresiones eg, €p1> » + + > €nrny> tal que: 
(1) dado el número n, e, sea efectivamente calculable, 
(11) dados n y las expresiones e,,, (0 < h < k), e,, sea efectivamente cal- 


culable (1 < k < r(n)), y 
(111) cuando se ha construido la serie completa de expresiones hasta e,,,¿,), 
sea patente que el cálculo ha terminado y cuál es el valor de F(n). 


Si asignamos el gódel [a] a cada expresión a y acordamos que el gódel de 
la lista (e,p, € , €,) sea el número 2*lé01 x 3Mémlx ...x p,Hend, pode- 


no... 


“El hecho de que dos definiciones de calculabilidad efectiva tan distantes entre sí (so 
widely different) y, sin embargo, igualmente naturales (en opinión del autor) resulten 
equivalentes refuerza las razones aducidas más abajo para creer que ellas caracterizan 
dicha noción del modo más general que es compatible con nuestra habitual compren- 
sión intuitiva de la misma” (Church 1936, p. 346, n. 3). 
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mos definir las funciones binarias G y H como sigue: 


G(n,x) = 0, si x es el gúdel de (€,0, €n1> --- > €nrm)) 

G(n,x) = Hle,,], si k = h+1, h< r(n) y x es el gódel de (8,0, €n1 - ++ > €np) 
G(n,x) = 1, en cualquier otro caso; 

H(n,x) = F(n), sí G(n,x) = 0; 

H(n,x) = G(n,x), sí G(n,x) + O. 


Si G y H son A-definibles o recursivas, también lo es F. Como señala Church, 
no es fácil imaginarse en qué podría consistir la postulada calculabilidad de 


las series €,,g, € , nr» Para cada n e N, si G y H no son A-definibles 


den 
O recursivas. 

Sin embargo, Church no se da por contento con este argumento, y adelan- 
ta otro. Nos pide imaginarnos “un sistema particular de logica simbólica” 
que contenga un signo = para la igualdad entre números naturales, un signo 
(35 () para indicar la aplicación de una función unaria al respectivo argu- 
mento y numerales que representen unívocamente a los números naturales. 
Los teoremas del sistema comprenden una lista finita o numerable de expre- 
siones, los axiomas formales, así como todas las expresiones derivables de 
éstas por una serie finita de aplicaciones de operaciones pertenecientes a una 
lista finita o numerable de reglas procesales (rules of procedure). “Para que 
el sistema sirva a todos los propósitos a que un sistema de lógica simbólica 
normalmente se destina es necesario que cada regla procesal sea una opera- 
ción efectivamente calculable, que el conjunto completo de las reglas proce- 
sales (si es infinito) sea efectivamente enumerable y que la relación entre un 
entero positivo y la expresión que lo representa sea efectivamente deter- 
minable” (1936, p. 357). Hecha esta observación, Church nos invita a supo- 
ner que ella significa que, en términos de una asignación de góúdels a las 
expresiones de la lógica, cada regla procesal es una operación recursiva, el 
conjunto de tales reglas es recursivamente enumerable,! el conjunto de los 
axiomas formales es recursivamente enumerable y la función que asigna a 
cada número el gódel del numeral respectivo es recursiva. Digamos con 


15 ”En el sentido de que existe una función recursiva D tal que D(n,x) es [el gódel] del 


resultado de aplicar la n-ésima regla procesal al conjunto ordenado finito de fórmulas 
[cuyo gódel] es x” (Church 1936, p. 357). 
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Church que una función unaria!? F es calculable en la lógica (within the 
logic) si hay en la lógica una expresión f tal que (fHu) = v es un teorema 
si y sólo si F(m) = n y u y v son los numerales que corresponden a m y n, 
respectivamente. Como el conjunto completo de los teoremas es recursi- 
vamente enumerable, no cuesta nada probar que toda función unaria calcula- 
ble en la lógica es recursiva (o A-definible). 


Se ha mostrado así que no es posible obtener una definición de calcula- 
bilidad efectiva más general que la arriba propuesta por ninguna de las 
dos vías que se ofrecen naturalmente, a saber, (1) definir una función como 
efectivamente calculable si hay un algoritmo para calcular sus valores y 
(2) definir una función F (de un entero positivo) como efectivamente cal- 
culable si, para cada entero positivo m hay un entero positivo n tal que 
F(m) = n es un teorema demostrable. 

(Church 1936, p. 358) 


Con estas palabras termina la presentación original de la llamada Tesis de 
Church. Me ha parecido oportuno repetir sus pormenores para que el lector 
se forme un juicio propio al respecto. Describirla como “definición” favore- 
ce un equívoco. En rigor, si la expresión “efectivamente calculable” en ade- 
lante va a significar por convención lingúística lo mismo que “recursiva” O 
“A-definible”, no puede conservar su significado corriente, establecido mu- 
cho antes de que estos dos términos técnicos hicieran su aparición.!” Gracias 
a que en castellano tenemos los dos sinónimos, “computable” y *calculable”, 
he podido evitar ese equívoco, reservando “computable” para los conceptos 
precisos —y equivalentes— introducidos en los años 30, y dejándole a *calcu- 
lable” su sentido habitual. Con esta terminología, los argumentos de Church 
pueden describirse así: se proponen dos análisis de lo que constituye un pro- 
cedimiento de cálculo, basados, respectivamente, en el modo corriente de 


Como dice Church con toda razón, la ampliación de este concepto a funciones n-arias 
“es inmediata”. 


No cabe alegar que como la extensión de ese significado corriente es “vaga”, el mate- 
mático puede libremente deslindarla como le parezca oportuno. Si antes de 1928 al- 
guien hubiera pretendido definir la expresión “efectivamente calculable” identificándola 
con “pr-recursiva”, el descubrimiento de la función de Ackermann habría puesto en 
evidencia que esa definición no sirve. La ausencia de criterios precisos, enunciables de 
una vez por todas, para aplicar un concepto corriente (“intuitivo”) no significa que no 
sepamos reconocer cuando se lo usa bien o mal. 
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ejecución de algoritmos “con papel y lápiz” y en el “cálculo lógico” a la 
Frege-Russell; en ambos casos, la equivalencia calculable <> computable se 
deduce del análisis, pero sólo después que cada uno de los pasos simples 
que, a la luz de ese análisis, constituyen el cálculo ha sido identificado con 
una operación de cómputo (recursiva o A-definible). La equivalencia global 
de calculabilidad y computabilidad se deduce, pues, de su identidad postula- 
da a nivel local. Por esto, el argumento no es propiamente circular, puesto 
que avanza de lo simple a lo compuesto, de los elementos al todo. Pero re- 
quiere que adoptemos como premisa, con respecto a los elementos de un 
procedimiento de cálculo, la identidad que se busca establecer como conclu- 
sión con respecto al procedimiento entero. En todo caso, gracias a los aná- 
lisis de Church ha quedado muy claro que para convencernos de la falsedad 
de su Tesis habría que producir un algoritmo “de papel y lápiz” en que el 
tránsito de una línea a la próxima no pueda representarse mediante una fun- 
ción recursiva, o un cálculo lógico efectivo que admita una regla de infe- 
rencia no recursiva o tenga un conjunto de axiomas o de reglas de inferen- 
cia no recursivamente enumerable. Como en más de medio siglo nadie ha 
inventado un algoritmo o un cálculo lógico así, es razonable creer que no 
hay ejemplos contrarios a la Tesis de Church. Por otra parte, la misma índo- 
le del concepto corriente de calculabilidad no permite enunciar condiciones 
necesarias y suficientes para su aplicación; al darlas uno justamente deja atrás 
el concepto corriente —“natural” o, sí se quiere, “histórico”— y lo reempla- 
za con uno artificial. Pero eso mismo impide ofrecer una demostración ma- 
temática de que el concepto corriente de función calculable coincide en ex- 
tensión con el concepto artificial de función computable (recursiva, A-defini- 
ble). Por eso, no parece justo describir la Tesis de Church como una conje- 
tura matemática que aguarda ser demostrada (comparable, digamos, a la con- 
jetura de Legendre de que r es un número transcendental, antes de que fue- 
ra demostrada por Lindemann). La veo más bien como una decisión de aceptar 
la computabilidad como criterio de calculabilidad hasta que un contraejemplo 
fuerce a pensar de otro modo. Como todo el enorme incremento reciente de 
la capacidad humana de calcular (en el sentido ordinario) depende de la exis- 
tencia de máquinas expresamente diseñadas para computar (en nuestro sen- 
tido técnico), no es verosímil que esa decisión vaya a revocarse.!* 


e Basándose en el análisis de la idea general de computación por Turing (vide infra, 
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La lista de teoremas que desemboca en la equivalencia entre funciones A- 
definibles y recursivas también incluye los siguientes: VII. El conjunto de 
las fbfs es recursivamente enumerable. X1. La relación de convertibilidad 
inmediata entre fbfs es recursiva. XUL. Es posible asociar a cada fbf F una 
enumeración G,, G;¡, G», ... de todas las formulas que cumplen la condi- 
ción F conv G,(k e N), de tal modo que la función binaria (*[F],k) => 
%*|[G,] sea una función recursiva. XUL. La propiedad de una fbf de estar en 
forma normal principal es recursiva. XIV. El conjunto de las fbfs que están 
en forma normal principal es recursivamente enumerable. XV. El conjunto 
de las fbfs que tienen una forma normal es recursivamente enumerable. 
Algunos de estos teoremas se emplean en la demostración del siguiente re- 
sultado, que a su vez es la base de la demostración del Teorema de Church, 


Sección 2.11.2) y la demostrada equivalencia de “función recursiva” y “función compu- 
table según Turing”, Mendelson 1990 arguye que la Tesis de Church no es menos cier- 
ta que otras proposiciones básicas de la matemática que nadie sueña con llamar “tesis”. 
Cita cuatro paralelos: (1) la definición habitual de “función” (lo que en este libro lla- 
mamos “aplicación”) como una relación binaria R tal que VxVyVz(Rxy a Rxz > y = 
z); Q) la definición de “verdad” propuesta por Tarski (vide infra, Capítulo 3.1); (3) la 
definición de “validez lógica” en la teoría de modelos (también tratada en nuestro Ca- 
pítulo 3.1), y (4) la definición de “límite” por Weierstraf. Ninguno de estos paralelos 
me parece convincente. (1) El citado concepto de “función” amplía resueltamente el 
concepto matemático que era corriente siglo XVIII, pero no cabe duda de que lo inclu- 
ye; en cambio, quienes llaman “tesis” a la definición de Church dirían que no sabemos 
con seguridad que todas las funciones que son calculables en la acepción corriente son 
A-definibles o recursivas. (2) La definición de “verdad” de Tarski se refiere a una pro- 
piedad de las fórmulas de un sistema formal y sólo una persona ignorante o muy 
irreflexiva puede entenderla como un intento de definir “rigurosamente” el concepto 
ordinario de verdad. (3) La definición modelista de “validez lógica” se halla en el mis- 
mo caso, pero, claro está, no hay un concepto corriente con el que éste pudiera con- 
fundirse (o identificarse); por otra parte, contra lo que sugiere Mendelson, no goza de 
aceptación incuestionada entre los cultivadores de la lógica (cf. Etchemendy 1990). (4) 
Me parece que la existencia de alternativas al análisis clásico (Weyl 1918; Brouwer 
1918, 1919, 1923; Lorenzen 1965; Bishop 1967; cf. asimismo Robinson 1961, 1966) y 
las sucesivas generalizaciones y redefiniciones del concepto de convergencia dentro de 
la misma tradición clásica (Moore y Smith 1922, H. Cartan 1937, Weil 1937) indican 
que el concepto de límite de Weierstraf no tiene el carácter definitivo que le atribuye 
Mendelson, aunque todavía se enseñe a los principiantes (con toda razón, como se les 
enseña la noción newtoniana de fuerza, igual a la masa invariable multiplicada por la 
aceleración absoluta). 
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que da una solución (negativa) al Entscheidungsproblem del cálculo predica- 
tivo de primer orden: 


TEOREMA XIX. No existe una función recursiva binaria f tal que (i) f(x,y) 
=0six=«$4*[X], y = *[Y] y X e Y son fbfs tales que X 
conv Y, y (ii) f(x,y) = 1 en cualquier otro caso. 


Church demuestra que el problema de hallar una función recursiva binaria f 
que cumpla las condiciones (1) y (11) del Teorema XIX equivale al problema 
de hallar una función recursiva unaria g tal que g(z) = 0 si z =*[Z] y Zes 
una fbf que tiene una forma normal, y g(z) = 1 en cualquier otro caso. En 
vista de esto, el Teorema XIX es un simple corolario del siguiente 


TeoreEMaA XVIII. No existe una función recursiva unaria g tal que (i) g(x) 
=0si x=+*[X] y X es una fbf que tiene una forma nor- 
mal, y (ii) f(x) = 1 en cualquier otro caso. 


De este modo, el "Teorema XVIII viene a ser la pieza clave en la solución 
del Entscheidungsproblem.'” No voy a dar aquí una demostración detallada 
de este teorema, pero parafrasearé la explicación sumaria que Church mis- 
mo da para aclarar la suya. Supongamos que el Teorema XVII es falso, y 
que existe la función recursiva g descrita en su enunciado. Sea R una fbf 
cualquiera. Si g(R) = 0, R tiene formas normales, una de las cuales es su 
forma normal principal R*. Según el Teorema XII, hay una enumeración de 
todas las fbfs en las que R es convertible. Recorriéndola se encuentra, tarde 
o temprano, la forma normal principal R*. R es convertible en un numeral si 
y sólo si R* es un numeral (por cuanto (a) la forma normal principal de R 
es única y (b) cada numeral está en forma normal principal). Por lo tanto, si 
el Teorema XVIII es falso, es posible determinar mediante un procedimiento 
de cómputo si una fbf cualquiera es o no convertible en un numeral. Según 
el Teorema XV, hay una enumeración efectiva Ap, A;, A,,... de todas las 
fbfs que tienen una forma normal. Sea n el numeral correspondiente al nú- 
mero n. Definimos la función unaria £ por la doble condición: (1) E(n) = 0 


13 Con certero sentido de la jerarquía, Kleene (1967, pp. 242, 246, 282) usa la expresión 


“Church's Theorem” —“el Teorema de Church*— para referirse al Teorema XVIII. Pero 
esa no es la nomenclatura habitual. 


2.11 Funciones computables 379 


si (4, (1) no es convertible en un numeral y (11) £(n) = m+1 si (A, Hn) conv 
m y mes el numeral correspondiente a m. La función E es computable y, 
por ende, A-definible mediante una fórmula que Church llama €. La demostra- 
ción rigurosa del Teorema XVIII culmina, precisamente, con la construcción 
de esta formula € y la prueba de que, si n es un numeral, (ej(n) es converti- 
ble en un numeral (Church 1936, p. 361). Siendo así parte de fbfs que tie- 
nen una forma normal, € tiene también ella misma una forma normal. Ahora 
bien, todas las fbfs que tienen una forma normal figuran en la lista Aj, Aj, 
A», ..., pero € no puede ser una de las fórmulas de esta lista, puesto que, 
según la definición de E, es imposible, para cada n e N, que (4,)(m) sea 
convertible en el numeral en que (en) es convertible. La suposición de 
que el Teorema XVIII es falso lleva así a una contradicción. 

El Teorema XVIII exhibe un ejemplo de función numérica no recursiva: 
la función g definida en su enunciado. Como el conjunto de las fbfs que 
tienen una forma normal es recursivamente enumerable (por el Teorema XV), 
el conjunto de las fbfs que no tienen una forma tal no puede serlo.?! El 
conjunto de los gódel de este conjunto es, pues, un ejemplo de conjunto 


20 Si (e)(n) es convertible en el numeral correspondiente a O, (A,)(n) no es convertible 


en un numeral; si (A,(n) es convertible en un numeral m, ([ej(n) es convertible en el 
numeral siguiente a m y, por lo tanto, no es convertible en m (si una fbf es convertible 
en un numeral, ese numeral es único, puesto que cada fbf tiene a lo sumo una forma 
normal principal y todo numeral es una forma normal principal). Como puede advertirse, 
el paso central de la prueba del Teorema XVIII reproduce el patrón clásico del argu- 
mento diagonal. Específicamente, la función E se ha definido deliberadamente de tal 
modo que ninguna fof A, —perteneciente a la lista Ay, Aj, A,,... — antepuesta al 
numeral n —correspondiente a su posición en la lista— sea convertible en el mismo 
numeral en que es convertible la fbf (ej(n), donde € es la fbf que representa a E en el 
cálculo A. Esta discrepancia garantiza que € + A,, para cada ne N. 

2 Sea q la función recursiva que enumera las fbfs que tienen una forma normal. Si hu- 
biera una función recursiva y que enumerase las fbfs que no tienen una forma normal, 
entonces mediante el examen de la secuencia 4(0), w(0), 9(1), vw), 00), vQ),... 
podríamos decidir en un número finito de pasos si una dada fbf A tiene o no una forma 
normal. En efecto, A sería igual, digamos, al r-ésimo término de esa secuencia. Si r = 
2n, A = q(n) y por lo tanto tiene una forma normal; si r = 2n+1, A = y(n) y por lo 
tanto no tiene una forma normal. De esto se infiere, por la Tesis de Church, que la 
función característica de la clase de fbfs que tienen una forma normal es recursiva. De 
hecho, construir una definición rigurosa de tal función recursiva, dadas q y y, deman- 
daría sólo un pequeño esfuerzo adicional. Pero su existencia contradiría al Teorema 
XVIII. Por lo tanto, no puede existir la función recursiva wy. 
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numérico no recursivamente enumerable. El Teorema XVII! implica además, 
como ya dije, el Teorema XIX. De éste Church infiere sin dificultad que “el 
Entscheidungsproblem es insoluble en el caso de cualquier sistema de lógica 
simbólica que sea (-consistente [...] y lo bastante poderoso como para 
admitir ciertos métodos de definición y prueba comparativamente simples” 
(1936, p. 363). Señala que en un sistema de esta clase se podrá expresar el 
aserto de que los números a y b son los gódel de fórmulas A y B tales que 
A es inmediatamente convertible en B. Como una conversión es una secuen- 
cia finita de fórmulas cada una de las cuales es inmediatamente convertible 
en la siguiente (si la hay), también cabe expresar en tal sistema —mediante 
una fórmula que llamaremos Y(a,b)— el aserto de que a y b son los gódel 
de fórmulas A y B tales que A conv B. Además, si A conv B y a=+H[A] y b 
= +[B], la fórmula Y(a,b) será deducible en el sistema mediante una prueba 
consistente en una cierta secuencia finita de conversiones inmediatas que lleva 
del numeral correspondiente a a al numeral correspondiente a b. Y si A no 
es convertible en B, la o0-consistencia del sistema implica que Y(a,b) no es 
deducible. Ahora bien, si el Entscheidungsproblem del sistema admitiera una 
solución positiva, habría un algoritmo para determinar si P(a,b) es o no 
deducible. Ese algoritmo permitiría entonces determinar, para cualquier par 
de fórmulas A y B, si A es o no convertible en B. En otras palabras, dicho 
algoritmo permitiría calcular la función f descrita en el enunciado del Teo- 
rema XIX. Pero f no es recursiva y, por lo tanto, según la Tesis de Church, 
no puede calcularse mediante un algoritmo. 

Aunque el razonamiento anterior emplea una terminología apropiada para 
hablar del cálculo A de Church, puede fácilmente adaptarse a cualquier cál- 
culo lógico de cierta clase muy amplia. Al final de su artículo, Church ob- 
serva que “en particular, si el sistema de Principia Mathematica es ()-con- 
sistente, su Entscheidungsproblem es insoluble” (1936, p. 363); pero no en- 
tra en detalles. En su “Nota sobre el Entscheidungsproblem”, publicada el 
mismo año, Church aplica el Teorema XIX específicamente al cálculo predi- 
cativo de primer orden de Hilbert y Ackermann (1928), concluyendo que “el 
caso general del Entscheidungsproblem [de dicho cálculo] es insoluble” 
(1936a, en Davis 1965, p. 114). En el Capítulo 2.7 consideramos dos formas 
del Entscheidungsproblem, según que el procedimiento algorítmico en cues- 
tión concierna la deducibilidad o la validez de las fórmulas de un cálculo 
lógico. Como se recordará, distinguíamos entre d-decisión y v-decisión. En 
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el caso del referido cálculo de Hilbert y Ackermann, los dos problemas co- 
inciden puesto que —en virtud del Teorema de Completud de Gódel (Capí- 
tulo 2.8) — una fórmula de ese cálculo es válida si y sólo si es deducible. A 
este respecto, Church hace una observación importante. Él ha demostrado 
constructivamente que no hay un algoritmo de d-decisión para dicho cálcu- 
lo: no puede existir una función recursiva que asigne el valor O al gódel de 
cada fórmula deducible y el valor 1 al gódel de cada fórmula no deducible. 
Por lo tanto, en virtud del Teorema de Completud, tampoco hay un algorit- 
mo de v-decisión. Pero la demostración del Teorema de Completud no es 
constructiva, de modo que la insolubilidad del problema de la v-decisión no 
se ha establecido constructivamente. Por esta razón, Church concluye que 
“la insolubilidad de esta segunda forma del Entscheidungsproblem del [cál- 
culo predicativo de primer orden de Hilbert y Ackermann] no puede consi- 
derarse incuestionablemente establecida” (1936a, en Davis 1965, p. 115). 


2.11.3 Las máquinas de Turing 


El artículo de Alan Turing, “Sobre números computables, con una aplica- 
ción al Entscheidungsproblem” (1936), aborda el tema del cálculo efectivo 
desde un nuevo punto de vista, que lleva a una definición inesperadamente 
simple de función computable, equivalente a las que hemos considerado hasta 
aquí. Una definición esencialmente idéntica a la de Turing fue propuesta 
independientemente por Emil Post (1936).22 Por su sencillez, esta definición 
de computabilidad es la preferida por los autores de obras didácticas. Aquí 
la utilizaré para demostrar, finalmente, el Teorema de Church (en la Sección 
2.11.5). Para mayor claridad, basaré el razonamiento en una variante de la 
definición original de Turing. Pero antes voy a presentarla en los términos 


El artículo —muy conciso— de Post apareció un poco antes que el de Turing, con una 
nota que reconoce la prioridad temporal de éste y aclara que los autores trabajaron con 
total independencia. Ambos, por cierto, conocían la labor de Gódel y Church. En el 
trabajo de Post falta completamente la idea de una máquina computadora. Lo que Turing 
(1936) llama la configuración interna de la máquina —“el programa”, como decimos 
hoy— Post (1936) lo presenta como instrucciones que ha de seguir un calculista (hu- 
mano). 
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empleados por él en 1936. 

Turing, como Church, usa el mismo vocablo para referirse a la noción 
corriente que le interesa deslindar con precisión y a la noción precisa defini- 
da por él. Pero en vez de “calculable” —como decía Church— Turing dice 
“computable”.22 Ocasionalmente encierra esta palabra entre comillas, para 
indicar que se refiere a la noción precisa. Por mi parte, seguiré usando “cal- 
culable” para la noción corriente y “computable” para la noción técnica. Diré 
“Ecomputable? cuando sea necesario distinguir el concepto de Turing (o sus 
variantes) de otras nociones equivalentes, como “recursiva general” o “A-de- 
finible”. 

El artículo de Turing se refiere expresamente a los números computables, 
esto es, “los números reales cuya expresión digital es calculable con medios 
finitos”.2* Pero, como Turing se apresura a señalar, su tratamiento se puede 
adaptar sin dificultad a “las funciones computables de una variable entera, o 
de una variable real o computable, los predicados computables, etc.” (1936, 
p. 230). Con la variante arriba aludida aplicaré la noción de “T-computable” 
a las funciones numéricas (aplicaciones de Y < N” en NI) de que tratan las 
dos subsecciones precedentes (las cuales, por lo demás —como señalé al 
comienzo de el Capítulo 2.11— entran en el cálculo de cualquier “número 
computable”). Pero primero atendamos a la noción original. 

Números computables, en el sentido descrito, son precisamente los que 
calculaban los calculistas (computers, en inglés), esos abnegados trabajado- 
res que, antes del advenimiento de la computadora electrónica, aplicaban “a 
mano” los algoritmos apropiados para construir tablas de logaritmos, senos, 
cosenos, etc., evaluar integrales, sumar series, al servicio de la ciencia y la 


e Reserva “calculable” —más precisamente, “effectively calculable”— para referirse al 


concepto de Church. Turing 1936 muestra en un apéndice que el concepto de Church 


tiene la misma extensión que el concepto de computabilidad definido por él. 


2% Donde pongo “expresión digital”, Turing escribe “decimal expression”, pero lo que 


quiere decir con eso es “expresión mediante dígitos de un sistema numérico cualquiera 
(fijo). Como veremos, sus “máquinas” —prefigurando la computadora electrónica— 
emplean el sistema binario. A propósito de ellas, Turing habla de “binary decimals”. 
Ello tal vez no molesta en una lengua en que el nombre del 10 no proviene del latín 
decem,; pero a nosotros un “decimal binario” nos suena disparatado y preferimos hablar 
de “dígitos binarios”. 
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ingeniería. Turing busca una definición precisa del término *calculable con 
medios finitos”. Para eso, describe una clase de máquinas ideales concebidas 
—según él — de modo que simulen perfectamente las operaciones de un 
calculista. Llamaré máquina de Turing a cualquier objeto de esta clase. Un 
número real es “computable” si hay una máquina de Turing que lo computa. 
Después de explicar como operan sus máquinas, Turing introduce la idea que 
inspirará la invención de la computadora moderna: la máquina de Turing 
universal UY, que computa el número computado por cualquier máquina de 
Turing /l cuando el número de identidad de Ml se registra como dato inicial 
en la memoria de YU. Siguiendo a Turing, daré primero la descripción gene- 
ral de una MT, luego ciertos resultados importantes de su trabajo, y por úl- 
timo repetiré el argumento en que basa su afirmación de que todo lo que 
pueda calcular un calculista es computable por una máquina de Turing. 
Una máquina de Turing /( se caracteriza, ante todo, por una lista finita 
do --->» 4 de estados (Turing dice “Ml -configurations”) en que Jl puede 
encontrarse y un alfabeto finito S,,..., S, de signos (“symbols”) que Jl 
puede reconocer e imprimir. Uno de éstos, digamos S,, es sólo un espacio 


en blanco. Ml lee y escribe en una cinta de papel cuadriculado 


. Entendemos que la cinta tiene una orientación; evocando nuestros propios 
hábitos de lectura y escritura, diré que J(l “avanza” hacia la “derecha” y “re- 
trocede” hacia la “izquierda”. En un dado momento, cada cuadrado de la cin- 
ta contiene un solo signo (posiblemente, el blanco S,). Suponemos que la 
cinta es infinita o, al menos, que le “crece” un cuadrado adicional en blanco 
apenas Ml llega a leer uno de sus extremos (éste es el único rasgo ideal de 
las máquinas de Turing, inimitable por calculistas y computadoras). Supone- 
mos además que en el momento inicial hay a lo sumo un número finito de 
cuadrados que “no están en blanco”, esto es, que contienen un signo dife- 
rente de S,, (este supuesto mitiga lo irrealista del anterior). En cada momento, 
ÁM está en uno de sus estados, leyendo un cuadrado de la cinta. Ese estado 
y el signo que hay en ese cuadrado determinan la próxima acción de .M, la 
cual consiste en ejecutar una de cada una de las tres alternativas siguientes: 
(1) escribir uno de los signos Sy, ..., S, en sustitución del signo que lee, (11) 
avanzar un cuadrado (llamemos a esto, A), retroceder un cuadrado (R) o 
permanecer detenida leyendo el mismo cuadrado (D) y (111) pasar a uno de 
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los estados qp, --. > 4 El funcionamiento de Jl queda, pues, completa- 
mente caracterizado por una lista finita de quíntuplos (q;,S,,S,,,C,qy), tales 
que 1 < h,k< mm, 1 < v,w< n, C es uno de los tres caracteres A, R, D, y no 
hay dos quíntuplos que comiencen con el mismo par (q),S,).22 El quíntuplo 
(4y»S,,S,,,C,qu) indica lo que Ml hace si lee el signo S, cuando se encuentra 
en el estado q): (1) reemplaza S,, por S,,, (11) efectúa la operación representa- 
da por C y (í1i) pasa al estado q,. Diré que la lista de quíntuplos caracterís- 
tica de Ml es el programa de Ml (Turing lo llama “la configuración comple- 
ta” de Ml, pero me parece que el término que he elegido no sólo es más 
breve, sino también, hoy por hoy, más expresivo). Para mayor precisión, 
supongo que el programa de una máquina de Turing está siempre ordenado 
alfabéticamente ((q,,S,,S,,C,q,) precede a (9pS,,S,,C,q) sih <f, o sih=fy 
A 

Turing propone un método sencillísimo para darle un número de identi- 
dad —un gódel— a cada máquina de Turing Ml. Si escribimos los subíndices 
numéricos de sus estados y signos como listas de palotes (l), separamos con 
punto y coma (;) los quíntuplos que forman el programa de Ml y eliminamos 


w w 


ES Obsérvese que la alternativa (1) incluye la posibilidad de dejar intacto el signo leído, 


puesto que es uno de los signos permitidos como sustituto. La alternativa (111) incluye 
la posibilidad de seguir en el mismo estado. 


26 En otras palabras, el programa de 4 es el grafo de una aplicación cuyo dominio está 


incluido en (0,...,m) x X0,...,n) y cuyo alcance está incluido en 
L0,..., nx AA,R, Ox 40,..., mp. 


2d La máquina 4 descrita es lo que Turing (1936, p. 232) llama una máquina automática 


o a-máquina, porque su funcionamiento está completamente determinado por el pro- 
grama. Menciona además lo que llama una “máquina a elección” (choice machine) y 
que hoy llamamos una máquina de Turing con oráculo (MTO), cuyo funcionamiento 
no está completamente determinado por el programa. Éste indica que cuando la máqui- 
na está en ciertos estados leyendo ciertos signos hay que consultar una fuente externa 
u “oráculo” —un operador humano, una tabla de números aleatorios, una ruleta, etc.— 
para determinar lo que la máquina ha de hacer en esa situación. Así, si Ml es una 
MTO, el programa de .M(, consta en parte de quíntuplos como los arriba descritos, en 
parte de triples de la forma (q,,S,,?) donde el signo de interrogación indica que hay 
que consultar el oráculo. La respuesta de éste tiene que ser un triple de la forma 
(S,,C,qy), pero no está predeterminado cuál será ese triple en cada caso. (Evidentemen- 
te, el programa de Jl, puede fijar distintas listas finitas de respuestas posibles en las 
diversas situaciones en que prevé una consulta al oráculo; también puede contemplar 
varios oráculos, de modo que la respuesta de uno remita a veces a otro). 
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los paréntesis angulares y las comas, podemos representar ese programa 
inequívocamente mediante un número construido así: ponemos 1 en vez de 
un palote, 2 en vez de S, 3 en vez de q, 4 en vez de A, 5 en vez de R, 6 en 
vez de D y 7 en vez de punto y coma. Por ejemplo, si M4, es una máquina 
de Turing con cinco estados y un alfabeto de dos signos cuyo programa, 
escrito en la forma acordada, es 


"q S,SD q; q,S SA qu q, SS, D qu; qy S, S D qu; y SSA q), 
su gódel 4*[.l,] es el número? 
321.263.173.122.431.173.112.216.311.117.311.212.631.117.311.122.431. 


La descripción anterior es bastante general y se aplica lo mismo a las 
máquinas de Turing que evalúan números computables, en el sentido de 
Turing, que a las que computan el número natural que una determinada fun- 
ción recursiva asigna a cada r-tuplo de números naturales, etc. Basaré en 
ella la definición variante anunciada arriba. Pero antes de proponerla, com- 
pletemos la descripción original de una máquina de Turing capaz de compu- 
tar la expresión digital de un número real o MTR (como diré para abreviar). 
Si se adopta, con Turing, el sistema numérico binario, una MTR requiere un 
alfabeto de sólo dos dígitos, O y 1, además del blanco S,. Pero la programa- 
ción se facilita si hay también signos auxiliares, que puedan usarse para “llevar 
cuentas” durante la computación (por ejemplo, para marcar el punto de la 
cinta en que la máquina debe interrumpir su avance y empezar a retroceder). 
Turing (1936, p. 118) asigna a sus MTRs un alfabeto con dos clases de sig- 
nos, aparte del blanco: los dígitos O y 1, y signos auxiliares “de segunda 
clase”. Sea, pues, /l una MTR con un alfabeto así. He aquí como Turing 
concibe su funcionamiento: Jl empezará a operar en cierto estado q, leyen- 


de El lector puede entretenerse en comprobar que Ml, hace lo siguiente cuando trabaja 


con una cinta vacía u ocupada sólo por una fila consecutiva y finita de palotes. Si JM 
empieza a funcionar en el estado q, leyendo el primer palote de la fila, o un blanco 
cualquiera si la cinta está vacía, entonces, la cinta cesa de funcionar (i) leyendo un 
blanco en una cinta vacía si el número inicial de palotes era par y (ii) leyendo el único 
palote de una cinta por lo demás vacía si el número inicial de palotes era impar. Si 
entendemos que una fila de n palotes consecutivos (n > 0) representa al número natu- 
ral n, es claro que JM, computa la función característica de la clase de los impares (si 
esta función se define como en la p. 43; si la función característica se define —como 
en la p. 333— a la manera de Gódel, .(, computa la de los pares). 
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do un cuadrado cualquiera de una cinta enteramente en blanco; siguiendo 
las instrucciones de su programa, imprimirá dígitos y signos auxiliares en la 
cinta. Aunque Turing no lo dice, vamos a suponer que Jl nunca imprime un 
dígito en un cuadrado a la izquierda del cuadrado inicial. Bajo este supues- 
to, es claro que, si se ignoran los cuadrados en blanco u ocupados por sig- 
nos que no son dígitos, los dígitos impresos por (4 forman una secuencia 
(finita o indefinidamente creciente). Turing la llama “la secuencia computa- 
da por la máquina”. Si la secuencia computada por Ml es finita, diremos con 
Turing que 4 es una MTR circular. Obviamente, (ML es circular si y sólo si 
hay un momento a partir del cual se estaciona para siempre en un cuadrado 
o se sigue moviendo pero deja de escribir dígitos. Si 4 no es circular, la 
secuencia (infinita) computada por ella es la mantisa —expresada en el sis- 
tema binario— de un número real a. en el intervalo [0,1].2 Turing llama a a 
“el número computado por 4”. Turing proclama que “un número es compu- 
table si la diferencia entre él y el número computado por una máquina no 
circular es un entero” (1936, p. 233).%% Si “computable” significa aquí calcu- 
lable (en el sentido corriente), esta declaración enuncia una “Tesis de Turing” 
homóloga a la Tesis de Church. 

Este concepto de circularidad entra en la demostración original de que hay 
una máquina de Turing universal, que Turing caracteriza como una MTR 
que, aplicada a una cinta que contiene el gódel de cualquier MTR no circu- 
lar, computa la secuencia computada por ésta. También determina la formula- 
ción —y demostración — del resultado más importante de Turing 1936. Tal 
como allí se presenta, éste se refiere al “problema de la circularidad”, que 
puede enunciarse así: determinar mediante un algoritmo si una MTR cuyo 
programa se conoce es o no circular. Turing demuestra que no puede existir 
una máquina de Turing que compute la función característica de la clase de 
las MTRs no circulares. Combinado con la tesis de que todo lo que es calcu- 
lable es T=computable, este resultado da una solución negativa al problema 


Sd Recuérdese que la mantisa de un número real es la parte de su expresión digital que se 


escribe a la derecha de la coma (del punto en el sistema anglosajón utilizado por Turing). 


20 Si hay una MTR que computa cierto número real a e [0,1], no cuesta nada programar 


una MTR circular que escriba la parte entera de un número real f tal que la —fBle N, 
y una tercera MTR (cuyo alfabeto incluya, posiblemente, la coma y el signo menos) 
que combine el producto de las dos anteriores. 
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de la circularidad. Como las MTRs nos interesan aquí muchísimo menos que 
las máquinas de Turing que computan funciones numéricas, es preferible 
estudiar la idea de la máquina de Turing universal en relación con éstas, así 
como el problema homólogo al de la circularidad que se plantea con respec- 
to a ellas: determinar mediante un algoritmo si una máquina de Turing cuyo 
programa se conoce computa o no una función numérica. Este problema se 
llama habitualmente “el problema de la detención” (the halting problem) 
porque se lo puede formular asi: si x es un número ¿es x el gódel de una 
máquina de Turing que, aplicada a cualquier dato numérico de cierto tipo 
(que represente un r-tuplo para algún r fijo), acaba deteniéndose ante un 
resultado numérico en la posición prescrita para recibirlo? En caso afirmativo, 
la máquina de Turing +[x] computa la función que asigna ese resultado al 
dato en cuestión. En caso negativo, esto es, si f[x] no se detiene nunca o se 
detiene en una posición distinta de la prescrita para recibir un resultado, obvia- 
mente f[x] no computa una función numérica. (Doy una explicación más 
exacta del “problema de la detención” en la Sección 2.11.5). 

A continuación doy una descripción canónica de las máquinas de Turing 
que computan funciones numéricas. Usaré la abreviatura MT para designar 
a las máquinas de Turing que obedecen a esta descripción. En primer lugar, 
estipularemos que todas las MT tienen un mismo alfabeto y siguen un pro- 
cedimiento convencional uniforme para la recepción de datos y entrega de 
resultados. El alfabeto consta solamente de dos signos: $, el blanco, que 
llamaré B, y S,, el palote l. (Para un trabajo práctico de programación sería 
cómodo disponer además de unos pocos signos auxiliares, pero su adopción 
no expande el reino de las funciones computables). Una fila de palotes, 
impresos en cuadrados consecutivos de la cinta, precedida y seguida de un 
blanco, representa un número natural determinado. Como, según la con- 
vención seguida generalmente en este libro, el primer número natural es 0, 
representamos el número n con una fila de n + 1 palotes. Representamos el 
r-tuplo (n,, . . . ,n,) mediante r filas de n,+1,... , n,+l palotes, respectiva- 
mente, con un solo blanco entre cada dos filas consecutivas. Para mayor 
brevedad, llamaré *número a la representación de un número mediante una 
fila de palotes, *r-tuplo a la representación de un r-tuplo de números me- 
diante una fila de r filas de palotes. Digo que una MT se aplica a un *nú- 
mero cuando lee su primer palote, y que se aplica a un *r-tuplo cuando se 
aplica a su primer *número. Digo que un blanco cierra un “número o un *r- 
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tuplo cuando sigue inmediatamente a su último palote y que lo abre cuando 
precede inmediatamente a su primer palote. Gracias a la sencillez del alfabe- 
to, podemos simplificar los programas. Arriba postulamos que una máquina 
de Turing reacciona en un cierto estado ante un signo dado con tres opera- 
ciones: (1) reemplazar el signo leído con un signo dado (posiblemente el 
mismo), (11) permanecer ante el mismo cuadrado o avanzar o retroceder a un 
cuadrado adyacente, (111) adoptar cierto estado (posiblemente el mismo). Ahora 
supondremos que la reacción de una máquina capaz de m estados diferentes 
consiste en ejecutar una de cada una de las dos alternativas siguientes: (1) 
reemplazar el signo leído con B o con l, o avanzar un cuadrado (4), o retro- 
ceder un cuadrado (R);*! (11) adoptar el estado q, (0 < k < m). El programa 
está dado entonces por una lista de cuádruplos de la forma (q,,S,,C,q,), don- 
de 1 <h,k<m, ve (0,1), C es uno de los cuatro caracteres B, l, A, R, y no 
hay dos cuádruplos que comiencen con el mismo par (q,,S,).2 Supondremos 
que una MT dada siempre empieza a operar en cierto estado, el estado ini- 
cial de esa MT, que siempre llamaré q, Obviamente, MT sólo llega a de- 
tenerse si su lista de estados incluye por lo menos un estado final, esto es, 
un estado que figura en cuarto lugar en uno o más cuádruplos del programa 
(y así hay operaciones que conducen a él), pero no figura en primer lugar en 
ningún cuádruplo del programa (y, por ende, no es el punto de partida de 
ninguna operación). Finalmente, supondremos que una MT nunca retrocede 
más de dos cuadrados a la izquierda de su posición inicial. 

Sea Ml una MT. Diremos que /l computa la función r-aria f:N" = N si 
su programa determina el siguiente comportamiento: cuando Jl se aplica en 


se Nota sobre la notación. Hablando de máquinas de Turing, uso en adelante varias for- 


mas de las letras a y r (mayúscula, minúscula, cursiva, recta, helvética, griega, gótica) 
para referirme a objetos u operaciones relacionados, respectivamente, con las dos di- 
recciones de la cinta: avance (hacia la derecha) y retroceso (hacia la izquierda). En 
inglés y alemán, usan la r (de right, Rechte = derecha) en lugar de nuestra a, la 1 (de 
left, Linke = izquierda) en vez de nuestra r. No quise usar el par de letras d e í, porque 
la í minúscula tradicionalmente denota un índice y la mayúscula se parece demasiado 


al 1 y al palote |. 


32 Al asignar un gódel a uno de estos programas, hay que distinguir el palote que es un 


signo del alfabeto, del palote que utilizamos como subíndice numérico para identificar 
a cada estado. Escribiendo los cuádruplos como antes, separados por punto y comas, 
podemos asignar el dígito 1 al palote subíndice (como antes), el 2 al palote signo, el O 
al blanco, el 3aq,el4aA4,el5aRyel 6 al punto y coma. 
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su estado inicial al *r-tuplo (n,, . . . ,n,), escrito en una cinta por lo demás 
en blanco, Jl se detiene, al cabo de un número finito de operaciones, aplica- 
da al “número f(n,,....,n,) en una cinta por lo demás en blanco. En otras 
palabras, si JW recibe una representación de (n,, ... ,n,) como dato, entrega 
una representación de f(n,,....n,) como resultado. En lo sucesivo, suelo 
llamar M(, a la MT que computa cierta función f. Si f es una función parcial 
(definida en una parte propia de N”), la máquina que la computa tiene el 
comportamiento descrito cuando el contenido inicial de la cinta representa 
un r-tuplo en que f está definida, pero sigue operando sin detenerse jamás si 
dicho contenido representa un r-tuplo en que f no está definida. 

De acuerdo con estas convenciones, el programa ' q,Blq,; qpl4go; 4,B49»; 
q,1Rq,' define una MT que computa la función sucesor, x > x+1. El lector 
puede persuadirse de esto, ya sea ejecutando el programa, por ejemplo, en 
una cinta en que está escrito el *número 3, ya sea estudiando la representa- 
ción gráfica del programa que presento y explico al comienzo de la Sección 
2.11.4 (p. 393). 

En esa sección analizo los programas de otras MT elementales y enseño 
a descomponerlos en partes que pueden combinarse para formar nuevos pro- 
gramas. Los recursos presentados allí me ayudarán a probar en la Sección 
2.11.5 que toda función recursiva es T-computable. Probaré también que toda 
función T-computable es recursiva y utilizaré este resultado para demostrar, 
a propósito de las MT que computan funciones numéricas, (I) que hay una 
MT universal, esto es, una MT que computa la función (LM. ¿],x) > f00) 
y (ID) que el problema de la detención es insoluble, esto es, que no hay una 
MT que compute la función característica del conjunto de números (x:x es 
el gódel de una MT que computa una función numérica). Pero antes de 
abordar estos temas, veamos cómo razonaba Turing para convencerse —y 
convencernos— de que sus máquinas son capaces de simular perfectamente 
las operaciones de un calculista humano. 

El argumento de Turing incluye (1) un “llamado a la intuición”, esto es, a 
nuestra idea de lo que puede o no puede hacer un calculista; (11) una defini- 
ción precisa de computabilidad —distinta de las presentadas aquí— que re- 
sulta ser equivalente a la T-computabilidad, y (111) una colección de ejem- 


33 Aplicada a una cinta que contiene el gódel de la MT que computa la función f seguido 


del *número x, la MT universal produce el valor de f correspondiente al argumento x. 


2.11 Funciones computables 390 


plos de “vastas clases de números que son computables”. Como las defini- 
ciones de computabilidad conceptualmente diversas pero extensionalmente 
equivalentes se han multiplicado desde 1936, si (11) ya poseía alguna fuerza 
persuasiva entonces, ahora ella tiene que ser arrolladora. En la Sección 2.11.5 
probaré que una función numérica es T=computable si y sólo si es recursiva. 
Omitiré, por eso, la parte (11) del argumento de Turing. También la parte (111) 
se ha vuelto prescindible, puesto que en medio siglo nadie ha podido señalar 
una clase de números —o una función numérica— que sea calculable pero 
no computable (en particular, en virtud del diseño mismo de las computadoras 
electrónicas, todo número o función calculable por una de ellas tiene que ser 
T-computable). En cambio, la parte (1) merece nuestra atención por su gran 
originalidad y sencillez, porque pone de manifiesto las consideraciones que 
inspiraron el diseño de las máquinas de Turing y porque convenció a Gúdel 
de que los nuevos conceptos precisos de computabilidad capturaban la no- 
ción ordinaria de algoritmo.** 

Turing recuerda que los calculistas normalmente trabajan escribiendo sig- 
nos en un papel. “Podemos suponer que ese papel está cuadriculado como el 
cuaderno de aritmética de un niño. En la aritmética elemental suele aprove- 
charse el carácter bidimensional del papel. Pero ello es prescindible y pienso 
que todos estarán de acuerdo en que la bidimensionalidad del papel no es un 
requisito esencial para calcular. Supongo, pues, que el cálculo se lleva a cabo 
en papel unidimensional, esto es, en una cinta dividida en cuadrados” (1936, 
p. 249).2% Cada cuadrado y los signos que pueden escribirse en él son, por 
cierto, finitos. Por eso hay que suponer que el calculista sólo tiene un núme- 
ro finito de signos diferentes a su disposición. En efecto, un alfabeto infinito 
de signos legibles tendría que incluir figuras tan poco diferenciadas que nin- 
gún calculista sería capaz de distinguirlas. Turing se apresura a señalar que 
la restricción del número de signos no es grave, puesto que siempre se pue- 
de usar una fila de signos como si fuera un signo más (así, en nuestro CP1 
generamos infinitas variables con los dos signos x y l, etc.). La conducta de 
un calculista está determinada en cada momento por los signos a que presta 


34 Gódel, CW, I, 369; OC, p. 196; citado en la Sección 2.11.1. 


39 ¿Fijó Turing con esta decisión el carácter distintivo de la computadora electrónica, que 


ejecuta sus Operaciones en serie y hasta el día de hoy (1 de abril de 1998) no era capaz 
de trabajar “en paralelo”, como lo hace el cerebro humano? 
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atención y por su “estado mental” (“state of mind”). Estos determinan ade- 
más el estado mental del calculista en el próximo momento. Turing apunta 
aquí a un carácter esencial del concepto de algoritmo: si el calculista no ajusta 
cada una de sus operaciones —conforme a las reglas del cálculo— a la si- 
tuación alcanzada anteriormente cometerá un error o interrumpirá su tarea; y 
la situación —de la cinta y de su mente— después de una operación de- 
pende exclusivamente de ésta y de los factores que la determinan.* Hay que 
suponer, además, que el número de signos que el calculista puede observar 
en un momento dado no excede un cierto número B. Para observar más de 
B signos, tiene que hacer observaciones sucesivas. Turing también supone 
finito el número de estados mentales de que el calculista es capaz, porque, 
según él, si fuesen infinitos habría algunos tan parecidos que el calculista no 
sabría distinguirlos. Aunque Turing obviamente no puede probar que la va- 
riedad de la conciencia de sí esté sujeta a esta limitación,?” creo que anota 
aquí acertadamente un rasgo esencial de esa forma de actividad que llama- 
mos “calcular”. Por otra parte, como Turing se apresura a señalar, esta limi- 
tación puede obviarse escribiendo más signos en la cinta. 


Imaginemos que las operaciones ejecutadas por el calculista se han di- 
vidido en “operaciones simples” que son tan elementales que no es fácil 
imaginar una división ulterior. Cada una de estas operaciones consiste en 
cierta alteración del sistema físico formado por el calculista y su cinta. 
Conocemos el estado del sistema si conocemos la secuencia de signos en 


ES Hay que suponer, claro, que se trata de la situación pertinente, esto es, del estado de la 


cinta y de la mente del calculista en cuanto es significativa para el procedimiento de 
cálculo. Si, al tiempo que escribe el próximo símbolo, el calculista derrama una taza 
de café sobre el papel, la nueva situación del papel y de su mente no depende exclu- 
sivamente de la operación de cálculo ejecutada. Aunque parece idiota, esta observación 
es importante, pues indica que para deslindar en el acontecer real lo que es o no es 
pertinente a un procedimiento de cálculo hay que tener más o menos en claro qué en- 
tendemos por “procedimiento de cálculo”. 


dl Aunque identifiquemos, como ahora está de moda, la mente con el encéfalo o una parte 


de él, siempre podría asumir infinitos estados diferentes en el trascurso de una vida, 
puesto que el espacio y el tiempo son infinitamente divisibles. En cuanto a la aptitud 
de la conciencia humana para distinguirlos, sabemos demasiado poco para aventurar 
una conclusión al respecto. Distinto es el caso de los símbolos que son marcas de tinta 
en un papel, puesto que podemos señalar umbrales bajo los cuales dos marcas son 
indiscernibles a simple vista o bajo un microscopio. 
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la cinta, cuáles de ellos observa el calculista (posiblemente en un cierto 
orden) y el estado mental del calculista. Cabe suponer que en una opera- 
ción simple no se altera más de un signo. Cualquier otra alteración puede 
dividirse en cambios simples de esta clase. [...] Cabe suponer, sin pér- 
dida de generalidad, que los cuadrados cuyos signos se alteran son siem- 
pre cuadrados “observados”. 

Además de la alteración de signos, las operaciones simples tienen que 
incluir cambios en la distribución de los cuadrados observados. Los nue- 
vos cuadrados observados tienen que ser inmediatamente reconocibles para 
el calculista. Me parece razonable suponer que sólo pueden ser cuadrados 
cuya distancia del cuadrado más próximo de los observados recién no 
exceda cierta magnitud fija. Digamos pues que cada uno de los nuevos 
cuadrados observados dista L cuadrados o menos de uno de los que aca- 
ban de observarses. 

(Turing 1936, p. 250) 


Turing contempla también la posibilidad de que algunos cuadrados estén 
marcados, lo que permitiría al calculista encontrarlos en cualquier momento 
aunque disten más de L cuadrados de cualquiera de los cuadrados bajo ob- 
servación. Señala que, si cada uno está marcado con un signo, podemos 
agregarlos a la colección de cuadrados observada en cada momento sin que 
ésta deje de ser finita. Por otra parte, si están marcados con secuencias de 
signos de longitud arbitraria su reconocimiento no puede ocurrir en un sólo 
acto, sino que requiere operaciones sucesivas. Así, por ejemplo, para distin- 
guir las secuencias 


1111111111111111111111111111111 y 111111111111111111111111111111 


hay que compararlas dígito por dígito, “tal vez marcando los dígitos con un 
lápiz para asegurarse de que uno no los cuenta dos veces”. 

Sin duda, una máquina de Turing puede ejecutar la labor descrita. “A cada 
estado mental del calculista corresponde un estado (m-configuration) de la 
máquina” (1936, p. 251). Cuando el calculista ve B cuadrados a la vez, la 
máquina los lee consecutivamente. Llamemos a esto una etapa de su funcio- 
namiento. En cada etapa E, la máquina puede alterar un signo en uno de los 
cuadrados leídos en £ o moverse de un cuadrado leído en E a un cuadrado 
cualquiera que diste a lo sumo £ cuadrados de alguno de los cuadrados leí- 
dos en E. La operación ejecutada y el estado al que la máquina pasa depen- 
den del signo leído y del estado en que la máquina se encontraba. 
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2.11.4 Diagramas y ejemplos 
Di arriba el programa de una MT que computa la función sucesor x => 


x+l. El diagrama siguiente —leído como explicaré enseguida— da una idea 
más clara de su forma de operar. 


1:A 1:R 


(1) 


Los tres círculos representan los tres estados posibles de la MT, identifica- 
dos por su respectivo índice numérico (en negrita). Para mayor claridad, lla- 
mo 0 al signo S, (el blanco) y 1 al signo S, (el palote). A y R denotan las 
operaciones de avanzar y retroceder un cuadrado. Como puede observarse, 
cada flecha se origina en un estado, va acompañada de dos caracteres (sepa- 
rados por dos puntos), y apunta a un estado. Estos cuatro elementos consti- 
tuyen obviamente un cuádruplo del programa. Cada flecha debe entonces 
entenderse así: cuando la MT está en el estado donde la flecha se origina, 
leyendo el signo anotado a la izquierda de los dos puntos, hace la operación 
mencionada a la derecha de los dos puntos y pasa al estado adonde apunta 
la flecha. El diagrama indica que cuando la MT en cuestión empieza a fun- 
cionar en el estado O leyendo el primer palote de una fila de n, avanza y se 
mantiene en el mismo estado. Sigue avanzando en el estado O hasta que lle- 
ga a un blanco. Entonces reemplaza ese blanco con un palote y pasa al es- 
tado 1. En ese momento la MT está leyendo el último palote de una fila de 
n+1. La cinta contiene, pues, el resultado buscado. Con todo, según nuestras 
convenciones, para “recibir” el resultado la MT tiene que estacionarse en el 
primer cuadrado de la fila que lo representa. Por eso, el programa dispone 
que la MT retroceda, en el estado 1, hasta encontrar el blanco que abre la 
fila de palotes que representa el resultado. En cuanto da con él, avanza un 
cuadrado, con lo cual se coloca ante el primer palote de la fila, y pasa al 
estado 2. Como el círculo que representa al estado 2 no es el origen de nin- 
guna flecha, se trata de un estado final, y la MT se detiene cuando lo alcan- 
za. 

El diagrama (2) representa —como el lector fácilmente comprobará— una 
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MT que computa la función cero, x > 0. (Recuérdese que representamos el 
número cero mediante un palote solitario; vide p. 387): 


(2) 


En estos diagramas se pueden discernir componentes que representan tareas 
parciales dentro de la computación total. Por ejemplo, en el diagrama (1), el 
componente que forman los estados O y 1 con las dos flechas que se orlgi- 
nan en el estado O simboliza la tarea de buscar un blanco en el cuadrado 
inicial o a su derecha y escribir un palote en el primero que encuentre; el 
componente formado por los estados 1 y 2 y las flechas que se originan en 
el estado 1 simboliza la tarea de buscar un blanco en el cuadrado inicial o a 
su izquierda y detenerse ante el primer palote a la derecha de ese blanco. 
Obviamente, tales tareas pueden formar parte de la computación de diversas 
funciones, en cuyo caso los componentes que representan a aquéllas figura- 
rán en los diagramas de las MT que computan a éstas (con los estados po- 
siblemente numerados de otra manera). Por otra parte, el diagrama de cual- 
quier MT se deja analizar en componentes que representan tareas parciales 
ejecutadas por esa MT. 

Llamo diagrama parcial —abreviado DP— a cualquier sistema de círcu- 
los unidos con flechas apto para representar del modo descrito una tarea 
parcial de cómputo, aunque no represente el programa de una MT. Todo DP 
satisface las condiciones siguientes: 


(1) hay un círculo inicial que no es el destino de ninguna flecha proce- 
dente de otro círculo; 

(11) hay un círculo final que no es el origen de ninguna flecha; 

(11) contiene un número finito (> 0) de círculos intermedios, cada uno de 


los cuales recibe por lo menos una flecha procedente de otro círculo y 
origina por lo menos una flecha que apunta a otro círculo; 

(1v) cada flecha sale de un círculo y llega a un círculo (posiblemente el 
mismo), y 
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(v) de cada círculo sale a lo sumo una flecha marcada 0:C y a lo sumo 
una flecha marcada 1:C (donde C es uno de los caracteres 0, 1, A, 
R). 


Según esta definición, el diagrama de una MT capaz de detenerse es un DP. 
Si F y G son dos DP, el DP F-G se obtiene identificando el círculo final de 
F con el círculo inicial de G (esto es, eliminando el círculo final de F y 
llevando todas las flechas que apuntaban a él a desembocar en el círculo 
inicial de G). A veces, digo que F-G se forma combinando F con G o aco- 
plando G a F. Escribo F?en vez de F-F y F" en vez de F.F”! (n >1). Del 
mismo modo, llamo (F.G)” al DP F-G-F-G. ...-F.G —formado acoplando 
n copias de F-G— el cual, por cierto, no es igual a F-F-....-FGG...-G 
= F”.G”. Diré generalmente que un DP hace o ejecuta tal o cual tarea, por 
decir que la representa. Si n es el número que lleva un círculo en un diagra- 
ma dado, el DP n —relativamente a ese diagrama— es el DP formado por 
ese círculo, con todas las flechas que se originan en él, suplementado por un 
único estado final al que apunten aquellas flechas que no retornan al círculo 
n. Por ejemplo, en el diagrama (1), el DP 0 es éste: 


1:A 


(3) 
0:1 


Apliquemos estos recursos a la descripción de una MT que compute la 
función constante x => n, esto es, la función que asigna a cualquier número 
x el sucesor del sucesor... del sucesor (n veces) de O. Evidentemente, su 
diagrama puede formarse acoplando al diagrama (2) de la función x > 0, n 
copias (acopladas) del DP (3), y acoplando al DP resultante una copia del 
DP 1 del diagrama (1), que busca el primer blanco delante suyo o a su 1z- 
quierda y se detiene ante el primer palote a la derecha de ese blanco (la 
ejecución de esta última tarea hace que nuestra MT se detenga en la posi- 
ción prescrita para recibir el resultado que escribió al ejecutar las tareas 
anteriores). Por ejemplo, el diagrama (4) representa el programa de una MT 
que computa la función constante x => 3. 
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(4) 


Consideremos ahora la MT que computa la k-ésima proyección de N”, esto 
es, la función (X;, - - - ,Xp» - + - ,X,) > Xx Esta MT debe buscar el (k-1)-ésimo 
blanco a la derecha del cuadrado inicial, borrando a su paso todos los palotes 
que encuentre en el camino; enseguida debe recorrer la fila de palotes que 
abre el (k-1)-ésimo blanco, preservándola intacta, pues ella representa a xy; 
luego ha de borrar todos los palotes que encuentre entre el k-ésimo y el r- 
ésimo blanco, y finalmente regresar al cuadrado que ocupa el primer palote 
de la fila preservada y detenerse ahí. Doy el diagrama de la MT que compu- 
ta (x,,x,,X3) > x,, la segunda proyección de NÍ. 


E hr E 


Sea F el DP 0-1 (esto es, el DP que forman los estados O y 1). Es fácil ver 
que el DP 3-4 es una copia de F. Advertimos (i) que F borra el “número a 
que se aplica y se detiene ante el primer palote del *número siguiente; (11) 
que el DP 2 recorre de comienzo a fin, sin alterarlo, todo *número al que se 
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aplica y se detiene en el primer cuadrado después del blanco que cierra ese 
*número; (111) que el DP 5 busca el primer palote que haya delante suyo o a 
su izquierda y se detiene a la izquierda del mismo cuando lo encuentra, y 
(1v) que el DP 6-7 es igual al DP 5:6 del diagrama (4), cuya tarea es buscar 
el primer blanco delante suyo o a su derecha y detenerse ante el primer palote 
a la derecha de ese blanco. Es claro, entonces que el DP F*-1.2.F.5.67 
representa el programa de la MT que computa la k-ésima proyección de NY. 

A continuación, enseñaré a construir diversos DP que ejecutan varias ta- 
reas básicas de cómputo. Los uso luego (en la Sección 2.11.5) para describir 
las MT capaces de computar cualquier función recursiva general definida a 
partir de funciones de esa clase conforme a los esquemas R4, R5 y RÓ6 de la 
Sección 2.11.1 (o sea, por composición, recursión y búsqueda del número 
mínimo que cumple cierta condición recursiva). Para facilitar las referencias 
designaré a cada uno de estos DP con una abreviatura mnemotécnica apro- 
piada. 

Los primeros cuatro DP ejecutan las cuatro operaciones elementales de 
que es capaz una MT: a avanza un cuadrado y Fr retrocede un cuadrado, haya 
lo que haya en el cuadrado inicial; | escribe un palote en el cuadrado inicial 
o lo preserva si ya lo hay, y Y produce un blanco o lo preserva. 


a 


Los dos DP siguientes salen del cuadrado inicial buscando el primer blanco 
a la derecha (Aj) o a la izquierda (R¿) y se detienen ante él cuando lo en- 
cuentran. 
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(A) 1:A 


A, y R; hacen otro tanto con el primer palote; para dibujarlos, reemplácese 
simultáneamente 1 por 0 y O por 1 en A, y Ro. 

Un “doble blanco” es un par de blancos consecutivos. Ap, busca el primer 
doble blanco a la derecha del cuadrado inicial y se detiene ante el primero 
de los dos cuadrados de ese doble blanco. Ay se detiene en el cuadrado inicial 
si éste forma un doble blanco con el vecino de la derecha. R¿y busca el pri- 
mer doble blanco a la izquierda del cuadrado inicial y se detiene ante el 
segundo de los cuadrados de ese doble blanco. Rpg se detiene en el cuadra- 
do inicial si éste forma un doble blanco con el vecino de la izquierda. 


El próximo DP es algo más complejo. La tarea que representa puede des- 
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cribirse así: si Ll] denota el blanco que cierra un cierto *número y no hay 
ningún palote a la derecha de Hl, copiar ese *número en la cinta inmediata- 
mente a la derecha de Ul y, concluida esa tarea, detenerse en el blanco que 
cierra la copia. Para facilitar las referencias he numerado los estados. 


Para verificar que C hace lo que dije, el lector debe escribir tres o cuatro 
palotes consecutivos en una línea de un papel cuadriculado, situarse en el 
cuadrado a la derecha del último palote y seguir las instrucciones del diagra- 
ma. Si, después de escribir o borrar varios palotes, la línea en que está ope- 
rando se torna confusa, copie en limpio su última configuración en una línea 
nueva y siga Operando sobre ésta. 

Consideremos ahora una variante de la tarea que ejecuta C. Supongamos 
que la cinta contiene un *n-tuplo seguido de blancos. Se trata de copiar al 
final del *n-tuplo (inmediatamente después del blanco que lo cierra), el 
(n—k)-ésimo *número del mismo y detenerse en el blanco que cierra la co- 
pia. Llamaré C, al DP que ejecuta esta tarea. (Con esta nueva nomenclatura, 
C = Co). Supondremos que C, parte del blanco UU que cierra el *n-tuplo. 
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Contando de izquierda a derecha, sea ¿1 el k-ésimo blanco anterior a O. ¿0 
es el blanco que cierra el *número que C, va a copiar. C, tiene que cruzar 
varias veces de izquierda a derecha y de derecha a izquierda, sin alterarlo, el 
*k-tuplo situado entre ¡1 y Ol. Para asegurar que esto ocurra hay que inser- 
tar en puntos apropiados de C una cantidad suficiente de copias de los DP 
Ro (que busca el primer blanco a la izquierda de la posición ocupada) y A, 
(que busca el primer blanco a la derecha de la posición ocupada). Igual que 
C, C, empieza escribiendo un palote a la derecha de Ul y retrocediendo a 
leer el *número que debe copiar. Entre 3 y 4 la copiadora retrocede de lla 
O), esto es, ejecuta la tarea del DP (R¿)*. Entre 7 y 8 va del primer palote 
del *k-tuplo al primer palote de la copia, para lo cual tiene que llegar a Ql, 
y avanzar un cuadrado: esa es la tarea de (Rea. Por último, cuando ha 
terminado de hacer la copia y, después de restaurar en su sitio original el 
“número que copió, llega a ¡1 en estado 11, C, repite la travesía de ¡Da Ul 
y Sigue hasta el primer blanco a la derecha de [U, que es el blanco que cie- 
rra la copia; en otras palabras, ejecuta la tarea del DP (A/)*!. A continuación 
represento gráficamente este análisis mediante un diagrama algo diferente de 
los utilizados arriba. 


(C) 


Cada rectángulo representa el DP cuyo nombre contiene. Se entiende que 
una flecha que une dos rectángulos A y B va del círculo final del DP repre- 
sentado por A al círculo inicial del DP representado por B. Una flecha grue- 
sa significa que la transición indicada ocurre cualquiera que sea el signo leído 
y envuelve solamente un cambio de estado (en otras palabras, una flecha 
gruesa representa dos flechas corrientes, con el mismo origen y el mismo 
destino, acompañadas, respectivamente, de las indicaciones 0:0 y 1:1). 
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En el curso de una computación puede ser necesario desplazar un *núme- 
ro en una dirección en que la cinta está completamente en blanco. Conside- 
remos la forma más simple de esta tarea. Llamo A, al DP que empieza a 
operar inmediatamente a la izquierda de un “número que sólo está precedi- 
do por blancos, desplaza ese “número un cuadrado hacia la izquierda y se 
detiene en el blanco que precede al *número desplazado. Obviamente 


A, = A/0-Roo 


A, ejecuta la tarea opuesta; para describirlo reemplácese “izquierda” por *de- 
recha” y “precede” por “sigue” —o intercámbiense A y R— en la ecuación 
precedente. 

También puede ser necesario acercar dos “números que estén separados 
en la cinta por más de un blanco. El DP siguiente, que llamaré T,, empieza 
a operar en el blanco que precede inmediatamente a un *número y traslada 
este “número hacia atrás hasta que entre él y el “número anterior no queda 
más que un blanco, en el cual T, se detiene. 


0:0 


a-1-A,r-0-R, 


(T,) 


Obsérvese cómo T, retrocede inicialmente un cuadrado; si encuentra un pa- 
lote, hay un solo blanco entre él y el *número siguiente; por ende, T, no 
tiene nada que hacer; avanza a ese blanco y se detiene. Pero si encuentra un 
blanco, retorna al blanco inicial, lo llena con un palote, avanza al extremo 
derecho del “número que va a trasladar, le quita el último palote, busca el 
blanco que ahora precede ese *número y recomienza su trabajo. El lector 
puede entretenerse en diseñar T,, que hace el trabajo inverso: empieza en el 
blanco que sigue inmediatamente a un “número y traslada ese *número ha- 
cia adelante hasta que entre él y el “número siguiente no queda más que un 
blanco, en el cual T, se detiene. 
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Es cómodo programar la MT que computa una función f de tal modo que 
escriba el valor de f a la derecha del argumento y de cualesquiera “números 
auxiliares que tenga que escribir mientras saca cuentas. Para que “reciba” el 
resultado, conforme a nuestra descripción canónica, estacionada en el primer 
palote de la fila que lo representa, en una cinta por lo demás en blanco, la 
MT tendrá entonces que borrar primero los palotes que representan el argu- 
mento y todos los *números auxiliares. El DP B, hace eso precisamente, si 
la cinta no contiene ningún *número separado por más de n blancos del 
*número más próximo a su derecha: partiendo del blanco que precede inme- 
diatamente al resultado, B,, retrocede borrando todos los palotes a su izquierda. 
Cuando B,, ha borrado el último palote en esa dirección, retrocede n+1 cua- 
drados y al detectar un blanco se pone a buscar el primer palote a su dere- 
cha —que será justamente el primer palote del resultado— y se detiene allí. 
Si todo lo que hay que borrar es el argumento de f, se puede tomar n = 1, 
que es la separación entre los “números de un *r-tuplo. Pero puede ocurrir 
que el programa de la MT en cuestión prescriba anotar *números auxiliares 
con una separación mayor (para distinguirlos). En todo caso, n será finito. 
Doy el diagrama de Bz, que tendremos ocasión de utilizar en la Sección 
2.11.5. 


O:R 


(B,) 
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Daré dos ejemplos de MT que computan funciones aritméticas ordinarias. 
MM, computa la función (x,y) > x + y, esto es, la suma de cualquier par de 
números naturales. 


M,= A¿FA¿(r0”Rya. 


Dada una fila de x+1 palotes seguida de un blanco seguido de una fila de 
y+l palotes, si Jl, empieza a operar, conforme a la descripción canónica, en 
el primer cuadrado de la primera fila, busca el primer blanco a la derecha, 
esto es, el que separa las dos filas de palotes; lo llena con un palote; busca 
nuevamente el primer blanco a la derecha; retrocede dos veces, borrando al 
paso dos palotes; busca el primer blanco a la izquierda y avanza un cuadra- 
do, con lo cual acaba situada ante el primer palote de una fila de x + y + 1 
palotes consecutivos, que es justamente el “número que representa a x + y. 

ML, computa la función (x,y) => xy, esto es, el producto de cualquier par 
de números naturales, El programa de Jl, es, por cierto, bastante más com- 
plejo que el de M,. Lo representaré mediante un diagrama como el que usé 
para C,. 


¡eL 
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Veamos cómo Ml, computa el producto xy. Sean *x e *y los *números que 
representan en la cinta a nuestros dos factores. Ml, avanza desde su posición 
canónica inicial sobre el primer palote de *x hasta el blanco UU entre *x e 
*y, Retrocede dos cuadrados. Si x = 0, JM encuentra un blanco. Su tarea 
restante —ejecutada por el DP en la línea superior del diagrama— consiste 
en borrar *y e ir a pararse sobre el palote único de *x. Pero si el segundo 
cuadrado anterior a [] no está en blanco, x > 1 y la tarea restante de Ml, 
consiste en (1) escribir a la derecha de *y un *(x-1)-tuplo de copias de *y, 
para que haya en la cinta x representaciones de y; (11) llenar con palotes los 
blancos que separan esas x representaciones de y, para que formen una fila 
consecutiva de palotes; (111) borrar los palotes que esa fila tiene en exceso 
de xy + 1, el número de palotes de *(xy); (1v) borrar *x, y (v) ir a detenerse 
sobre el primer palote de *(xy). El lector debe comprobar que el DP cuyo 
componente inicial (marcado con a) está a la derecha del componente ini- 
cial de ML, ejecuta precisamente esta conjunción de tareas. 

De acuerdo con nuestra descripción canónica, la MT que computa una fun- 
ción numérica recibe una cinta en que sólo está representado un argumento 
y entrega una cinta en que sólo está representado el valor correspondiente. 
La MT borra, pues, los datos antes de entregar el resultado. Esta convención 
es razonable, pero resulta incómoda en ciertas ocasiones. Por ejemplo, para 
computar la función compuesta 


A AA y A E A 


donde h es una función T-computable m-aria y g;,..., £,, son funciones “T- 
computables n-arias, conviene disponer todo el tiempo del dato (x;,... ,X,,) 
mientras se computan sucesivamente los valores respectivos de £;,...., £p» 


y tener todos estos valores a mano para computar el valor buscado de h. 
Con este propósito, asociaré a cada función T-computable f un diagrama 
parcial D, que entrega el valor de f para cada argumento que se le suminis- 
tre, sin borrar de la cinta la representación de ese argumento. D, empieza a 


trabajar en el blanco que cierra la representación de (x,,.... . ,x,), escribe a su 
derecha una fila de f(x,,... ,x,)+1 palotes y se detiene en el blanco que cierra 
esta fila. 


No es difícil probar que una función n-aria f puede asociarse con un DP 
D, que cumpla las condiciones señaladas si y solo si existe una MT Ml, que 
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computa a f con arreglo a nuestra descripción canónica. Llamaré M ¡al DP 
que ejecuta la tarea de /M,. (La diferencia más significativa entre M, y Ml, 
consiste en que M, puede trabajar en una cinta que contenga palotes a la 
izquierda del *n-tuplo a que se aplica, cosa que, según nuestra descripción 
canónica, JW, no puede hacer). Si D, está dado, podemos poner 


M,= royD¿RyB, 


M, empieza en el primer palote del *n-tuplo que representa el argumento, 
busca el primer doble blanco a su derecha, ejecuta la tarea de Dj, retrocede 
al blanco que separa el argumento del correspondiente valor, y finalmente 
ejecuta la tarea de B, que borra el argumento y se detiene en el primer pa- 
lote del valor. Supongamos ahora que MI, está dada y que sólo incluye “borra- 
dores” del tipo B, con k < q. Ponemos entonces 


D, = aba(C,) (Ry) O-RRoy((A)%AyA/r).a-M¿r-T; Ago 


Analicemos las tareas que D, cumple antes de ejecutar la tarea de M,. Em- 
pieza a operar en el blanco a la derecha del *n-tuplo que representa el argu- 
mento. Avanza un cuadrado, escribe un palote y avanza otro cuadrado, si- 
tuándose en un blanco que llamaré (]. La tarea siguiente, ejecutada por el 
DP (C,,”, consiste en copiar el argumento a la derecha de [. (Recuérdese 
que C, copia a la derecha del blanco inicial el *número que está separado 
por n “números de ese blanco y se detiene en el blanco que cierra la copia; 
en su primera aplicación, pues, C, copia el primer *número del argumento, 
que está separado de [] por los n-1 *números restantes y el palote recién 
escrito; en la segunda aplicación, C, copia el segundo *número del argu- 
mento, ... , en la n-ésima, el n-ésimo). Luego, el DP retorna a U (que ahora 
es el n-ésimo blanco a la derecha del blanco donde se concluye la última 
aplicación de C,), retrocede un cuadrado, borra el palote que escribió al 


38 En verdad, D; no es sino una máquina de Turing que computa f de acuerdo con una 
ki 


descripción canónica diferente, que pude muy bien adoptar —como hace Hermes 
(1961) — en vez de la que dí en la Sección 2.11.3; pero esta última tiene ventajas 
didácticas. 
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principio, y busca el doble blanco que precede al *n-tuplo original. La tarea 
siguiente, ejecutada por el DP ((A,) Ay A; r)”, consiste en desplazar el *n- 
tuplo original q cuadrados a la izquierda, para ponerlo fuera del alcance de 
los “borradores” incluidos en M,. En efecto, (A,)1 desplaza q cuadrados a la 
izquierda el *número que esté inmediatamente a la derecha del blanco don- 
de empieza a operar; Ay A, llevan al primer palote del “número siguiente y 
r al blanco que inmediatamente lo precede. La n-ésima aplicación de 
((A,)2 Ay A;r desplaza q cuadrados a la izquierda al último *número del *n- 
tuplo referido y se detiene en el blanco inmediatamente a la derecha de la 
copia; la copia estará separada entonces por q+3 blancos del último *núme- 
ro del *n-tuplo original.*? Avanzando un cuadrado, nos colocamos sobre el 
primer palote de la copia, a la que se aplica M,. Como sabemos, la tarea de 
M, consiste en reemplazar esa copia, por el *número que representa el valor 
correspondiente de f, eliminando con sus “borradores” todo *número que 
preceda a ese valor y diste a lo sumo q blancos del “número siguiente. Con- 
forme a la descripción canónica, M, se detiene en el primer palote del resul- 
tado. A gran distancia a la izquierda la cinta contiene el *n-tuplo original. 
La tarea final de D,, ejecutada por r-T,, consiste en trasladar a la izquierda 
el resultado hasta que entre éste y el *n-tuplo original no haya más que un 
solo blanco, y avanzar desde allí hasta llegar al blanco que cierra el resulta- 
do, donde D, se detiene. 


32 Para poner al *n-tuplo original fuera del alcance de los “borradores” de MI, basta en 


rigor con una separación de q+1 blancos, de modo que sería suficiente utilizar (A)? 
en vez de (A,)“. 
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2.11.5 Demostración de resultados 


I. Toda función recursiva es T-computable. Hay que probar que cualquier 
función numérica definida según uno de los esquemas R1-R6 de la Sección 
2.11.1 es T-computable.* Los diagramas (1) y (2) de la Sección 2.11.3 ex- 
hiben las MT que computan la función sucesor 0:x > x + 1 y la función 
cero x > 0, respectivamente. El diagrama (5) exhibe, a título de ejemplo, la 
MT que computa (x;,,x,,x3) > x,, la segunda proyección de N*. En general, 
la k-ésima proyección de N” es computada por AjyyC, Ay B;. 

Si h es una función recursiva m-aria T-computable, asociada al DP D, y 


81» +» ->8, Son funciones recursivas n-arias T-computables, asociadas a los 
DP D,,..., D,,, respectivamente, la función compuesta f:X;,,...,X,) => 
M8i(r, +. Xp), + E ml(X]> + - + X,)) es recursiva (por R4) y T-computable por 


la MT descrita a continuación: 


My = Ao a-l- a(C,)"” R”.r.0. Ao D -(C,)"- D, o «(C,)” D 
Cm-tyen(m-ty Cim-1)en(m-2) "Co 1D, Ry Bs 


El funcionamiento de ./((, es tan sencillo como ingenioso. Después de situar- 
se en el primer blanco a q derecha del *n-tuplo que representa el argumento 
(Xi, + +. ,X,), escribe un palote en el blanco siguiente, avanza al próximo blanco 
y copia ese *n-tuplo; luego borra el palote auxiliar, dejando tres blancos entre 
el original y la copia; avanza al blanco que cierra la copia y escribe a su 
derecha el *número que representa a g¡(x¡,... ,x,); (C,)” produce una se- 
gunda copia del argumento a la derecha de ese *número y D, escribe el 
*número que representa a g,(x;,....,x,) a la derecha del blanco que cierra 
esa segunda copia. Los puntos suspensivos indican la repetición de (C,)”-D 
con k=3,...,n-1. Cuando D,, concluye su trabajo, Ml, se encuentra situa- 
da en el blanco que cierra un *m(n+1)-tuplo formado por representaciones 
de (Xp... X8(Xp, > + ,X,)) (1 < k < m), con un blanco intercalado entre 
cada dos representaciones consecutivas. La tarea siguiente, efectuada por el 
DP Cim-1entm-11 Cím-tjentm-ay + + "Em, Consiste en copiar, a continuación del 


dd Con R6 ajustado a las indicaciones del párrafo que le sigue. 


2.11 Funciones computables 408 


*m(n+1)-tuplo indicado, precisamente los m *números que representan a 
Bj... Xp) +++ > Emp) + + - >x,).* Por último, D,, operando desde el blan- 
co que cierra este *m-tuplo, escribe a su derecha el *número buscado, que 
representa a Mgylis.: Apds o Enf 25) = FU + + 7): AB da los 
últimos toques necesarios para entregar el resultado en la forma convencio- 
nal prescrita en nuestra descripción canónica. 

Sea g, una función recursiva n-aria T-computable asociada al DP D, (o 
una constante, si n = 0) y g, una función recursiva (n+2)-aria T-computable 
asociada al DP D,. Sea f la función (n+1)-aria definida por recursión así: 


FO) + XD) = 8/01) --- X,) 
FG, ... Xy +1) = EÁX;» ... Xy es Xy) 


de Comprobemos este aserto, trabajando, por ejemplo, con m = 3 y n = 2. Llamo X al 


*número que representa el número x, 9, a la representación de g,(x,,x,). H es un blan- 
co. Empezamos a la derecha de la fila xy 0x20lg,0x, Hx»0go0x,0x201g3. Cg copia 
91. Luego C,, empezando a la derecha de x,0x20g, 0x, Ox>09g,0Xxy Oxo0g¿0l9;, 
copia 9). Luego, empezando a la derecha de xy x>0194 0x4 0dx20g,0x; Dxo0g¿09;, 


C> copia 9. 
ña Mi definición de f se aparta un poco del esquema R5, con el propósito de hacer más 
sencillo el diagrama de la MT que la computa. Para tranquilizar al lector desconfiado, 
mostraré aquí que la diferencia es inocua. Supongamos, pues, que q es la función (n+1)- 


aria definida, según el esquema RS, por las relaciones 


PUO,Xp) +1) = Y, --- Xp) 
PO+ÍL, XL > Xp) = 00) ++ Ap Y) Xp) + + X,,) 
donde y, y y, son funciones recursivas y T-computables y las funciones g, y g, satisfa- 
cen las condiciones 8, = Y Y Bx(Xj> +++ >X 240) = Volpi 40 M5 > + + > Xp). Mostraré que 
2, es recursiva y T-computable. Sea 1, la k-ésima proyección de N”*?; sabemos que Ty 
es recursiva (por R3) y T-computable. Por consiguiente, también lo es la función com- 
puesta 


A 


Por lo tanto, la función f definida arriba en el texto es T-computable por la MT ahí 
descrita. Es claro, entonces, que la función compuesta 


A O E A O A PA) 


también es T-computable. 
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f es recursiva (por R5) y T-computable por la MT representada en el diagra- 
ma siguiente: 


Ay a-la-C(C,.)"R Hr Ay: DC, ¡1er 


l.a:C o D>C,, 3 5-9: r 


n+2" 


Dejo a cargo del lector el análisis de su funcionamiento (para simplificar, 
suponga que n = 1). 

Sea g una función recursiva general (n+1)-aria T-computable, asociada al 
DP D (n > 0). Digamos que f es la función n-aria definida por f(x;,... ,x,) 
= Uy(g(X¡, -.. ,X,,y) = O. Entonces f es recursiva (por R6) y TEcomputable 
por la MT representada en el diagrama siguiente: 


¿Cómo trabaja? Supongamos que se aplica al *n-tuplo que representa el argu- 
mento (X;¡,...,X,). Partiendo de su primer palote, busca el blanco que lo 
cierra, avanza un cuadrado, escribe un palote, avanza otro cuadrado y aplica 
D al *(n+1)-tuplo precedente, que representa (x;, ... ,x,,0). Si D produce un 
solo palote, quiere decir que g(x;, ... ,x,,0) = 0. La ejecución de r-9.r colo- 


2.11 Funciones computables 410 


ca entonces a nuestra MT ante un blanco, inmediatamente a la derecha del 
resultado buscado. Como siempre, Ry Bz asegura que éste se entregue en la 
forma convenida. Pero si D produce más de un palote, g(x,,... ,x,,0) % 0. 
La MT borra entonces el número que escribió D, agrega un palote al último 
*número del *(n+1)-tuplo precedente, y repite el ejercicio anterior. De esto 
modo, computará sucesivamente g(x;,... ,X,,1), g(%;,... ,X,,2), . . . hasta dar 
con el primer número » tal que g(x;,,....x,./ó) = 0. 

Así queda demostrado que cualquier función recursiva es T-computable. 


11. Toda función T-computable es recursiva. Sea f una función r-aria T-com- 
putable por la MT M,. Ya sabemos identificar a /(¿ mediante un gódel. 
Mientras 4, computa el valor de f para un dado argumento x e NY, la cinta 
presenta sucesivamente distintas configuraciones; cada momento o etapa de 
la computación queda exhaustivamente descrito por la indicación de (1) la 
configuración de la cinta en esa etapa; (11) el estado momentáneo de Ml, y 
(ii) el cuadrado que Ml, está leyendo. Se puede definir un gódel que repre- 
sente toda esta información. Como el tránsito de cada etapa a la próxima 
está determinado por el programa finito de 4 ,, se pueden definir funciones 
recursivas que asignen al gódel de cada etapa, el gódel de la etapa siguiente. 
Sobre esta base, es posible definir una función recursiva que asigna el valor 
f(x) al par formado por el gódel de .W, y el gódel de la etapa inicial de la 
computación de f(x). Tal es el método estándar para demostrar este resulta- 
do,* que produce al mismo tiempo pruebas de los resultados IMI-VI. Pero 
aquí seguiré otro método más simple, debido a Boolos y Jeffrey (1980, Cap. 
8); luego completaré esquemáticamente la demostración estándar a propósi- 
to del resultado IV. 

Para llevar a cabo la demostración propuesta necesitaré algunos concep- 
tos auxiliares, que explico a continuación en párrafos numerados del 1 al 6. 


1. Definición de una función mediante una lista finita de condiciones. Sea 
( una función numérica definida en Y < N" mediante n condiciones de la 
forma 


p(x) = y¿Qx) si y sólo si el r-tuplo x e C, (1<k<m) 


ds Ideado por Kleene; véase su tratado didáctico (1952), o la exposición muy clara y pre- 


cisa de Davis (1958, Capítulo 4). 
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donde (C;,..., C,) es una partición de Y. Sea y, la función característica 
de C,. Obviamente, q es la función compuesta definida por 


2) = 4/60 — 1100) +... + w, 200 — XL) 


Decimos que q es una función definida mediante una lista finita de condi- 
ciones. Si Y¡,..., Wa X1>--- > %, SON funciones pr-recursivas, q también es 
pr-recursiva. 

2. Maximización acotada. El lector conoce la función r-aria definida por 
“minimización acotada” x > uy(y € $60) a R(y,x)), cuyo valor, para cada r- 
tuplo x, es el mínimo número y < p(x) que cumple la condición R(y,x). Como 
indiqué en el paso 3” de la prueba del primer teorema de incompletud de 
Gódel (p. 334, (++), esta función es pr-recursiva si la función q y la relación 
R lo son. Ahora definiré por maximización acotada la función x > My(y < 
d(x) A RQ,x)), cuyo valor es el máximo número y < Q(x) que cumple la 
condición R(y,x). Sea P la condición definida por P(y,x) O (R(y,x) A Wz(z < 
d(0) > (> y > —R(2,x)). Obviamente, My(y < $00) a RO),x)) = UYO E $) 
A P(y,x)). Por lo tanto, nuestra función de maximización acotada es pr- 
recursiva si la función q y la condición R lo son. En particular, defino por 
maximización acotada la función O que asigna a cada x e N el máximo 
número w < x tal que 2” < x; en el acto advertimos que 0(2**1-1) = z. 

3. Codificación de r-tuplos. Sea p, el k-ésimo número primo. La función 
r-aria 


e A O O 


es pr-recursiva (cf. pp. 336 y ss.) y puede utilizarse para identificar inequí- 
vocamente un r-tuplo numérico mediante un solo número (un gódel). En vez 
de T”,(x¡,X>, - - . ,x,) escribimos [x;,x», . - - ,*,]. Si x designa el r-tuplo 
(XX, » « » ,X,), escribo [x] por I',(x). Consideremos ahora la función II, que 
asigna a cada número x el máximo número z < x tal que x es divisible por 
(p,)*. Según lo explicado en el párrafo 2, II, es pr-recursiva. Obsérvese que, 
si x es el gódel de un r-tuplo y 1 < k< r, I1,(x) es el k-ésimo número del r- 
tuplo en cuestión. En otras palabras II,([x]) = T.,G0). 

4. Codificación de computaciones. Sea MM una MT que computa una fun- 
ción r-aria f. Las etapas de la computación de f(x) pueden numerarse, diga- 
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mos, de O a n. En la etapa t, Mi lee un determinado cuadrado de su cinta, 
escrito o en blanco, que llamaré [l”. Si equiparamos cada palote con el dígito 
1 y cada blanco con el dígito O, podemos leer el contenido de la cinta, a la 
izquierda de 1, como la representación de un número natural en el sistema 
binario. Llamo a ese número, el número de la izquierda p, correspondiente a 
la etapa t. El contenido del resto de la cinta, a partir de [l', también puede 
leerse de derecha a izquierda, como la representación binaria de un número 
natural, el número de la derecha 0., (en cambio, si lo leemos de izquierda a 
derecha obtenemos una secuencia infinita de dígitos del sistema binario, que, 
después del último palote, son todos ceros). Llamaré “a, (*p,) a la represen- 
tación binaria de al, (p,). Obsérvese que a, es par si y sólo si [l' está en 
blanco y que p, es par si y sólo si está en blanco el cuadrado contiguo a la 
izquierda de ['. El tránsito de la etapa 1 a la etapa 1+1 puede describirse, 
como en nuestros diagramas, por un par de caracteres separados por dos 
puntos, S:C, donde S e (1,0) y Ce (1,0,A,R)$. Hay, pues, ocho casos po- 
sibles. Si el tránsito es 0:0 o 1:1, p,,, =P, y 0A,,, = QA, En los seis casos 
restantes, no es difícil determinar los valores de p,,, y a,,, en función de p,, 
y A, respectivamente. En el caso 0:1, p,,; =P, y QA, = A, + 1. En el caso 
1:0, P.¡ = P, Y A, = A, — 1. En el caso 0:A, p,,, = 2p, Cp,,, es igual *p, 
seguido de un 0) y a,,, = 0,//2 (Ca, es igual a %a.,,, seguido de un 0). En el 
caso 1:A, p,, = 2p,+ 1 Cp,,, es igual *p, seguido de un 1) y a, = (a, -1)/ 
2 Ca, es igual a %a.,,, seguido de un 1). En los casos O:R y 1:R el resultado 
varía según que p, sea par o impar; en cambio, la paridad de a, —depen- 
diente de que [1' contenga un O o un 1— da lo mismo. Si p, es par, P,,, = 
p/2 y 0,,, = 20, Si p, es impar, p,,, = (p"1)2 y Q.,,, = 201, + 1. Recorde- 
mos finalmente que en el sistema binario, una secuencia de p unos represen- 
ta el número 2” — 1, una secuencia de p unos seguida de q ceros representa 
a (2? — 1)21%, y una secuencia de p unos seguida de un cero seguido de q 
unos representa a (2? — 1)2%*! + (21 — 1). Por lo tanto, si f es binaria (r = 2), 
cuando Ml, computa a f(x,y), y se aplica en la primera etapa de la computa- 
ción al *par formado por x+1 palotes a la izquierda de un blanco a la iíz- 
quierda de y+1 palotes (con el resto de la cinta en blanco), es claro que py, 
=0 y Uy = 2*! = 1924 (2**l= 1), Adviértase que la función £,:(x,y) => 
(Qt —= 1)2: 4 (2++1 — 1) es pr-recursiva.** En el caso general (r > 1), 


sd La función pr-recursiva (x,y) +> x=y se definió en la p. 333, nota 22; es igual a x — y 


si y < x; de otro modo, es igual a 0. 
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, 
9 = Qi Y AAA 1) 
j=1 


En la etapa n-ésima y final de la computación, 4, se aplica a una fila de 
fG00)+1 (en una cinta por lo demás en blanco), de modo que p, =0 y a, = 
2/00+1. Recordando lo dicho al final del párrafo 2, comprobamos que O(a,,) = 
$). 

5. Codificación de programas. Sigamos considerando la MT ML, que com- 
puta la función r-aria f. Representamos numéricamente los estados, símbo- 
los y operaciones de Mi de acuerdo con las convenciones siguientes: el es- 
tado q, (0 < k < m) estará representado por el número k+1; los símbolos S, 
(blanco) y S, (palote) estarán representados por O y 1, respectivamente; las 
operaciones O, 1, A y R estarán representadas por O, 1, 2, y 3, respectiva- 
mente. Las dos funciones binarias O y O que definiré en seguida están com- 
pletamente determinadas por el programa —o el diagrama— de Ml, y lo 
representan de modo inequívoco. Ponemos O(x,y) = u y O(x,y) = w si Mi 
ejecuta la operación representada por u y pasa al estado representado por w 
cuando lee el signo representado por y en el estado representado por x. Pero 
si x e y no representan, respectivamente, un estado y un símbolo de Ml. ,, o si 
el programa de JW, no asocia una operación y un nuevo estado al estado y al 
símbolo representados por el par (x,y), entonces O(x,y) = y y O(Gsy) = 0. 
Obsérvese que, en virtud de esta estipulación, si x representa el estado final 
de Me, O(0,y) = 0. Como el programa de Mi consta de un número finito de 
cuádruplos, es claro que O y O son funciones pr-recursivas definidas me- 
diante una lista finita de condiciones. 

6. La función B,. Definiré una función pr-recursiva (r+1)-aria B, con la 
siguiente propiedad: si f es una etapa en la computación de f(x) por Ml, y 
q(t) es el número que representa el estado de (¿en £ —pero q(t) =0 si Ál, 
se ha detenido antes de f— entonces B(t,x) = [p,,q(t),a,]. Según la conven- 
ción del párrafo 5, q(0) = 1. Recordando que p, = 0 y ay = €,(x), definimos: 


(1) B/(0,x) = [0,1,6,(x)] 


Antes de seguir con la definición de By, introduzco algunos símbolos y abre- 
viaturas. Sea x/y = x dividido por y, si x es divisible por y y x/y =0 si x no 
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es divisible por y; Sea e:N = (0,1) tal que e(x) =0 si x es par, e(x) = 1 si 
x es impar. (Ambas funciones son pr-recursivas). Como vamos a definir B, 
de tal modo que B;(t,x) —para un dado r-tuplo x— sea el gódel de un triple, 
adoptaré tres abreviaturas para designar los tres números codificados en di- 
cho gódel, para un dado 1; llamaré r, al primero, q, al segundo y a, al terce- 
ro.* Llamaré OQ, al número O(q,.e(a,)).** Obsérvese que (a) si q, = g(1) y a, 
= 0.,, O, es el número que representa el estado alcanzado por /M, en el trán- 
sito de la etapa t a la 1+1, y (b) si Ms se detiene en o antes de la etapa t, O, 
= 0. Completamos la definición de B, con la siguiente estipulación: 


[x,,0,,a,] si e(1,)=0 y O(q, e(a,))=0 
[x,,0 ,,0,] si g(a,)=1 y O(q,,e(a,))=1 
[r,,0,a,+ 1] si e(a,)=0 y O(q,e(a,))=1 
[5.0.1 =1] si g(a,)=1 y O(q,,e(a,)) =0 

(ii) Bft+1x)=< [2r,,0,0//2] si e(a,)=0 y O(q,,e(a,)) =2 
[21,+1,0 ,,(a, 1/2] si e(a,)=1 y O(q,.e(a,)) =2 
[1,/2,0 ,,20,] si e(a,)=0 y O(q,,e(a,)) =3 
[(-,=1)/2,0,2a,+ 1] si e(a,)=1 y O(q,.e(a,)) =3 
0 en cualquier otro caso 


La función B, es pr-recursiva, puesto que la hemos definido mediante una 
lista finita de condiciones pr-recursivas (cf. p. 411). Las alternativas pro- 


45 Estrictamente hablando, con el vocabulario del párrafo 3, ponemos t, = 11,(Bf(t,2)), q, 


= IL(B (4,2), a, = 113(B/(1,2)). Conforme a esta definición, Y, = q,=,=0 si By(t,z) = 
O. 


46 Dicho sin abreviaturas: O, = Q(T1,(B (t,2)),(11/(B ((1,2))). 
sil Imitando a Boolos y Jeffrey (1980, p. 94), he tomado un atajo para facilitar la lectura 
e interpretación de la cláusula (11). En rigor, la definición de B, debiera ajustarse al 
esquema de recursión RS, con g y h definidas mediante una lista finita de condiciones 
pr-recursivas. Ponemos g(x) = [0,1,€,(x)]. En (ii), reemplazamos By(t+1,x) por h(t,y,x) 
y redefinimos Y,, 4, 1, y O, como sigue: Y, = I1,(y), q, = LG»), a, = 1130»), O, = 
Q(U1L0»),(1L GO»). Entonces, la función B¿ dada por 


Bf(0,x) = g(x) 
B¡t+1,x) = h(t,B ((t,x), x) 


es idéntica a la definida en el texto. 
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puestas en las primeras ocho líneas a la derecha de la llave corresponden 
precisamente a los ocho casos posibles examinados en el párrafo 4. Compa- 
rando lo dicho allí con los valores asignados a B(t+1,2) en esas ocho líneas, 
comprobamos que, para cada 1 2 0, B(t+1,x) = [p,,,,q(1+1),0.,,1], conforme a 
nuestra exigencia inicial. Si en la computación de f(x), M, llega a su estado 
final en la etapa t, la lista B¡(0,x), do B (t,x) provee una descripción com- 
pleta, etapa por etapa, de dicha computación, y B(y,x) = 0 para todo y > 1. 
Obviamente, q, = IL(B/(,1)) = 0 si y sólo si y > í, pues si y < 1, q, es el 
número que representa el estado en que se encuentra Ml, en la etapa y, el 
cual, según nuestras convenciones, es siempre positivo. 

Con estos recursos podemos, finalmente, establecer el resultado. Acaba- 
mos de ver que Ml, se detiene en la etapa 1 de la computación de f(x) si y 
sólo si f = wa (+11) = 0). La función q:x > wyUL(B (+1, x)) = 0) 
es recursiva (aunque no necesariamente pr-recursiva). Como indiqué al final 
del párrafo 4, si Mi se detiene en la etapa £ de la computación de f(x), f(x) 
= O(a,) =. Pero a, = a, = I1,(B,(1,x)). Por lo tanto, 


$60) = OL (B(460,x)) (5) 
Como función compuesta de funciones recursivas, f es ciertamente recursiva. 


1H. Forma normal de una función recursiva. Sea f una función recursiva r- 
aria. Entonces, f es T-computable (I). Por lo tanto, f es idéntica a la función 
compuesta al lado derecho de la ecuación (*). Dicha función se forma por 
composición de la función pr-recursiva O o IIz o B, con la función q defini- 
da por minimización (según el esquema R6) a partir de una función pr- 
recursiva. Por lo tanto, toda función recursiva puede definirse por una serie 
finita de aplicaciones de los esquemas de recursión primitiva R1-R5, con a 
lo sumo una aplicación del esquema R6.% 


AS El resultado III no es igual al Teorema de la Forma Normal de Kleene (1936) enuncia- 


do en la p. 366 (inmediatamente antes de la nota 5). Kleene mostró que cualquier fun- 
ción recursiva general según la definición de Herbrand-Gódel tiene una forma normal 
como la descrita arriba, y basó en esto la conclusión de que las funciones recursivas 
generales de Herbrand-Gódel pueden todas definirse mediante los esquemas R1-R6. Pero 
nuestro resultado 1, invocado en la prueba del resultado III, se basa él mismo en la 
definición de función recursiva mediante los esquemas R1-R6. 
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IV. La máquina universal de Turing. Turing (1936) da el programa de una 
máquina que, aplicada al gódel de una MTR cualquiera, computa el número 
real computable por ésta. La tarea de esa máquina consiste, esencialmente, 
en descifrar el gódel a que se aplica y seguir el programa allí encapsulado. 
Es probable que este concepto de una máquina universal haya inspirado a 
von Neumann (hacia 1945) la idea matriz de la computadora moderna: en 
vez de materializar el programa en los circuitos del aparato (como hardware), 
suministrárselo como información (en la forma de software). A continuación 
esbozaré una prueba de que, para cada entero positivo r hay una MT univer- 
sal Y, que computa el valor de cualquier función T-computable r-aria en cada 
r-tuplo x perteneciente a su dominio, cuando se le suministra el (7+1)-tuplo 
(i,x), donde ¡ es el gúdel de la MT que computa a f.* Llamaré Ml, a la MT 
cuyo gúdel es ¡ y f, a la función que ella computa. Diré que ¡ es el indice de 
la función f,. El índice í de la función T=computable f,encapsula el progra- 
ma Jl, y, por ende, contiene toda la información necesaria para definir la 
función pr-recursiva Bs, descrita en 11.6; en adelante, escribo B, en vez de 
B;,. Si f, es r-aria y el r-tuplo x pertenece a su dominio, la computación de 
f(x) por Ml, termina en cierta etapa £ y —como se vio en IL.6— la secuencia 
finita B(0,x), ..., B¡(t,x) contiene toda la información necesaria para descri- 
bir dicha computación, etapa por etapa. Si conocemos t esta información 
puede encapsularse en el gódel [B,(0,x), ..., BAt,x)]. Como B¡(u,x) + O para 
todo u < t y B¡(u,x) = 0 para todo u > f, en verdad no hace falta conocer tf 
para definir un gódel que encapsule la información. Ponemos, simplemente,% 


TG alí”, O a Si f, está definida en x, ocurre que a partir de 
cierto valor finito del índice k los factores del producto infinito I'(1,x) llevan 
todos el exponente O y son, por ende, iguales a 1. En tal caso, I'(i,x) es pre- 
cisamente el gódel de la computación de f(x) por Ml,, tal como se lo definió 
arriba. Si f, no está definida en x, I'(i,x) excede a cualquier número señalable 
y puede considerarse indefinido. Recordando la definición 7 en el paso 4” de 
la Sección 2.10.2, vemos que, si I'(i,x) está definido, “(1(i,x)) es igual al 
número de los factores primos de I'(i,x) y, por ende, es igual al número 1 de 


+ El argumento bosquejado a continuación se debe a Kleene; vide p. 410, nota 43. 


Só Recuérdese que, según la definición 5 en la p. 336, p, = 0 y, para r > 0, p, es el r- 


ésimo primo (p, = 2, p, = 3, p3=5,...). 
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la etapa en que termina la computación de f;¡(x) por Ml, Definimos la fun- 
ción ternaria 7, mediante una lista de dos condiciones: 


T(u,v,w) =0 si ues el índice de una función T-computable r-aria, v es el 
gódel de un r-tuplo v en el dominio de f,, y w = “(T(u,v)). 
T(u,v,w) = 1 en cualquier otro caso. 


Como las condiciones son recursivas, T, es una función recursiva.*! También 
es recursiva la función binaria ywxu,v) > uw(T,(u,v,w) = 0), cuyo valor, en 
cada par (u,v) en que esté definida, es precisamente el número de la etapa 
en que la MT Ml, se detiene en la computación de f,(v). Recordando la ecua- 
ción (*) en la p. 415, defino la función (r+1)-aria 


D,(1,x) > OL GB (yG[x),x). 


d, es una función recursiva y, por ende, T-computable. Sea U, la MT que 
computa a D,. U, es la MT buscada. 


V. El problema de la detención es insoluble. El problema de la detención 
puede formularse así: decidir mediante un algoritmo si una MT se detiene 
cuando se aplica a cierto “número. Si aceptamos la tesis de Church (o el 
análisis de la actividad de un calculista propuesto por Turing), el problema 
equivale a este otro: hallar una función T-computable binaria A tal que A(u,x) 
=0 si u es el índice de una función T-computable f, definida en x, y A(u,x) 
= 1 en cualquier otro caso. Evidentemente A(u,x) = 0 si y sólo si la compu- 
tación de f,(«) termina en alguna etapa t, esto es, si y sólo si Iw(T(u,[x],w) 
= 0). Mostraré que el problema de la detención es insoluble o, mejor dicho, 
que tiene una solución negativa: la función T-computable A no existe. Con 
ese propósito, defino la siguiente función total: 


Y La recursividad de las condiciones impuestas a u y v puede establecerse utilizando los 
predicados y funciones definidos en el paso 4” de nuestra demostración del primer teo- 
rema de incompletud de Gódel (pp. 335-341). Pero también podemos invocar la Tesis 
de Church, puesto que hay sin duda algoritmos para decidir si un número dado es o no 
el índice de una función T-computable o el gódel de un r-tuplo (para un r > 0 fijo). La 
condición impuesta a w depende de las condiciones anteriores y de las funciones 
recursivas l y IT. 
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p() = f,() + 1 si IM(T|(x,[x],w) = 0) 
pb) =0 en cualquier otro caso. 


Si q es T-computable, tendrá un índice a. En otras palabras, y será idéntica 
a la función T-computable unaria f,. Como q es total, está definida en a, de 
modo que 3w(T¡(a,[a],w) = 0). Por lo tanto, f,(a) = p(a) = f,(a) + 1. Como 
esto es imposible, concluimos que (q no es T-computable. Supongamos aho- 
ra que existe la función T-computable A arriba descrita. Entonces, la función 
p podría computarse así: dado un número x, computar A(x,x); sí A(x,x) = 0, 
xes el índice de la función T-computable f, definida en x y, por ende, po- 
demos computar f(x) + 1 que es el valor correcto de p(x) en ese caso; si 
A(x,x) = 1, ponemos ((x) = O, que es su valor correcto en este caso. Como 


( no puede ser T-computable, so pena de contradicción, tampoco puede existir 
una función T-=computable A como la arriba descrita. 


VI. El cálculo predicativo de primer orden es indecidible. La solución nega- 
tiva del problema de la detención es homóloga, en la teoría de las MT, al 
Teorema XVIII de Church 1936 (Sección 2.11.2), en la teoría de la A- 
computabilidad. Por eso, no ha de sorprendernos que ella lleve directamente 
a la solución negativa del Entscheidungsproblem de Hilbert y Ackermann. 
Por su parte, Turing (1936), como era natural, derivó este resultado de su 
solución negativa del problema de la circularidad, concerniente a sus MTRs. 
El Entscheidungsproblem de Hilbert y Ackermann demanda un algoritmo para 
determinar si una fórmula dada del cálculo predicativo de primer orden es 
válida o no. En virtud del Teorema de Completud de Gódel (1929, 1930) 
estudiado en el Capítulo 2.8, el problema tiene una solución positiva si y 
sólo si hay un algoritmo para determinar si dicha fórmula es deducible o no 
en el cálculo organizado como sistema deductivo completo. Por lo tanto, según 
la Tesis de Church, el Entscheidungsproblem sólo podrá resolverse positiva- 
mente si existe una función computable $ tal que (1) 0(x) está definida si y 
sólo x es el gódel de una fórmula £ del cálculo predicativo de primer orden 
y (11) 8(x) = 0 si £ es deducible en el cálculo y 8(x) = 1 si € no es deducible 
en el cálculo. Este problema está íntimamente ligado al problema de la de- 
tención porque la teoría de las funciones T-computables se puede formalizar 
en el cálculo predicativo de primer orden. En particular, es posible asociar a 
cada par de números (x,y), una fórmula ¿(x,y) que es deducible en el cálculo 
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si y sólo si x es el índice de una función T-computable unaria definida en y. 
La función que asigna a (x,y) el gódel de la fórmula correspondiente £(x,y) 
es computable. Llamémosla y. Es claro que, si existiera la función computa- 
ble Í arriba descrita tendríamos que S(y(x,y)) = 0 si y sólo si 3w(T,(x,[y],w) 
= 0). Por consiguiente, la función compuesta 6 o y sería idéntica a la fun- 
ción A que resuelve el problema de la detención (véase el V). Pero hemos 
demostrado que esa función no existe. Por lo tanto, 8 no existe.*? 


da Varios autores dan la demostración en detalle. Especialmente clara y simple es la ver- 


sión de Boolos y Jeffrey (1980, Capítulo 10), basada en Biichi 1962. 


2.12 CONSISTENCIA DE LA ARITMÉTICA: 
LA PRUEBA DE GENTZEN 


Los escritos de Gúdel, Church, Kleene y Turing a que me refiero en los 
Capítulos 2.10 y 2.11 son obras maestras de la “metamatemática”, que apli- 
can con ejemplar virtuosismo los recursos de la aritmética finitista (Capítulo 
2.5) al estudio de cálculos lógicos. Sus resultados no favorecen las aspira- 
ciones de la escuela de Hilbert. Hilbert y Bernays (1939) anuncian a sus 
lectores que, a la luz del descubrimiento de Gódel, su programa de funda- 
mentación de las matemáticas demanda una ampliación del punto de vista 
finitista.! Toda la ampliación requerida consiste en admitir como un método 
propiamente “finito” la inducción transfinita que Gerhard Gentzen invoca en 
sus dos demostraciones de la consistencia de la aritmética formalizada (1935, 
1938). 

Las dos demostraciones de Gentzen difieren significativamente en los 
detalles —el cálculo a que se aplica la segunda difiere del considerado en la 
primera— pero ambas se inspiran en la misma idea. Se propone un sistema 
deductivo para lo que Gentzen llama “teoría pura de los números” (reine 
Zahlentheorie), que es lo mismo que aquí hemos estado llamando aritmética 
elemental. Imitando a Gentzen, llamaré derivaciones a las pruebas de ese 
sistema (él dice Herleitungen). Las derivaciones admisibles se ordenan por 
niveles, a partir de un nivel mínimo. El orden está diseñado de tal modo 
que, si hay una derivación A que concluye en una contradicción, tiene que 
haber otra derivación A* con la misma conclusión, tal que A* tiene un nivel 
más bajo que A. Por otra parte, será obvio que las derivaciones de nivel 
mínimo no pueden concluir en una contradicción. De esto se deduce, por 


Bernays reconoce, en el prefacio al tomo II de Fundamentos de la matemática: “En 
contraste con la definición anterior del “punto de vista finitista”, ha resultado necesario 
ampliar el marco de los modos de inferencia sustantivos admitidos en la teoría de la 
prueba” (“die Notwendigkeit [hat sich] ergeben [...], den Rahmen der fir die 
Beweistheorie zugelassenen inhaltlichen Schlufweisen gegeniibber der vorherigen 
Abgrenzung des “finiten Standpunktes” zu erweitern” — Hilbert y Bernays 1939, p. vii). 
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inducción sobre el nivel de las derivaciones, que ninguna derivación del sis- 
tema puede desembocar en una contradicción. Pero la inducción de que aquí 
se trata rebasa los límites del “modo recursivo de pensar” patrocinado por 
Skolem (1923) y aceptado sin reservas en la escuela de Hilbert. Aunque el 
conjunto de las derivaciones admisibles es, por cierto, numerable,? el orden 
que hay que darle para los efectos del argumento de Gentzen no es isomórfico 
a 6, sino a un ordinal mucho mayor.* Por lo tanto, la inducción requerida se 
extiende sobre todos los ordinales menores que ése. Se razona así: (1) Nin- 
guna derivación del nivel ínfimo lleva a una contradicción. (11) Si una deri- 
vación de nivel € lleva a una contradicción, hay una derivación de un nivel 
n < € que también lleva a una contradicción. (111) Por lo tanto, si ninguna 
derivación de nivel n < £ lleva a una contradicción, las derivaciones de ni- 
vel € tampoco llevan a una contradicción. Esta forma de razonar no me 
merece ninguna duda, pero me cuesta trabajo llamarla finita o finitista. 

La argumentación de Gentzen es tortuosa —tanto, que juzgó necesario 
reescribirla— pero, exceptuando la inducción descrita, es enteramente ele- 
mental; en particular, la construcción, para cada derivación con conclusión 
contradictoria, de otra derivación equivalente de menor nivel es una simple 
transformación de un objeto finito en otro objeto finito, y la complicación 
viene sólo de la variedad de los casos posibles. Examinaré en detalle la ver- 
sión de 1938. Presento el cálculo en la Sección 2.12.1. Este cálculo es in- 
consistente si y sólo si hay derivaciones de la clase que llamaré “fatales”. 
En la Sección 2.12.2 demuestro que toda derivación fatal se deja reducir a 
otra de la misma clase, construida de tal modo que preceda a la primera en 
el orden definido por Gentzen. En la Sección 2.12.3 doy la definición de 
este orden, lo uso para fundamentar la inducción arriba esbozada y hago 
algunas observaciones sobre la índole de ésta y su utilidad dentro y fuera 
del programa de Hilbert. 


Como cada derivación es una colección finita de signos es posible asignarle un gódel 
a cada una, ordenarlos de menor a mayor y contarlos. 

Concretamente, el primer ordinal £, tal que w% = £. Este es el número que Cantor lla- 
mó ey (1895/97, $20). Es, por cierto, un número de la Clase II: el conjunto de sus 
predecesores es infinito pero numerable (véase el capítulo 1.5). 
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2.12.1 Un cálculo aritmético 


En 1934, Gentzen y Jaskowski introdujeron en sendas publicaciones 
independientes los sistemas de “deducción natural” que prevalecen hoy en la 
enseñanza de la lógica. En el Apéndice IX.G propuse, a modo de ejemplo, 
un sistema deductivo de ese tipo, adaptado a nuestro CP1. El lector que no 
lo haya visto debiera echarle una mirada ahora (pp. 496-99). Ese sistema es 
muy parecido al que Gentzen adoptó en su artículo de 1935. En 1938 adopta 
otro, que presentaré aquí. El cambio facilita la reducción en el nivel de las 
derivaciones. Pero el nuevo cálculo es por lo menos tan poderoso como el 
anterior. En su parte lógica, es por lo menos tan poderoso como el cálculo 
de primer orden que Gódel (1930) demostró que era completo (véase Apén- 
dice XVIII). Como se trata de probar la consistencia de la aritmética forma- 
lizada en el cálculo, no importa que sea más poderoso: si no se puede deri- 
var una contradicción en el cálculo más poderoso, tampoco se la puede de- 
rivar en el más débil. 

El cálculo de Gentzen (1938) es un cálculo predicativo de primer orden. 
Gentzen no enuncia reglas para la formación de variables y predicados, pero 
podemos adoptar las de nuestro CP1 (Apéndice IX.A). El signo 1 es la úni- 
ca constante (en la aritmética formalizada, *1” designa el primer número na- 
tural).* Cada variable es un término. 1 es un término. Si t es un término, T' 
es un término. (El signo * opera pues como un functor pospuesto a su argu- 
mento; en la aritmética formalizada, 1' designa el siguiente del número de- 
signado por 1). Un término que no contiene una variable es un término nu- 
mérico. Se admite cualquier número de predicados de cualquier n-ariedad 
con la única condición de que sean decidibles: si D es un predicado n-ario 
y T¡, +... , T, SON términos en que no figura ninguna variable, tiene que haber 
un procedimiento efectivo para decidir si PT, ...T, €s O no verdadero (en la 
interpretación aritmética indicada). En los ejemplos de Gentzen figuran los 


La elección del signo indica, sin duda, que Gentzen prefería contar desde uno: eins, 
zwei, drei... Dadas nuestras preferencias, habría que entender que “1” designa el nú- 
mero cero (como en las representaciones gráficas de máquinas de Turing en la Sección 
2.11.4), o reemplazarlo por el signo “0”. Pero el lector ya se habrá acostumbrado a 
pensar que todo esto da lo mismo; el significado de la constante *1” queda fijado tan 
precisamente como es posible si estipulamos que ésta designa el único número que no 
es el siguiente de otro. 
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predicados binarios = y >, escritos, como es habitual, entre los términos a 
que se aplican.? El procedimiento de decisión en ambos casos es obvio: si t, 
y T, SON términos sin variables, 1, = 1, es verdadero sí y sólo si hay igual 
número de signos ' en T, y T, y 1, > 1, €s verdadero sí y sólo si hay mayor 
número de signos ' en t, que en 1,. Conviene advertir que “=” no es aquí un 
signo lógico: no hay reglas de inferencia para introducirlo ni su presencia o 
ausencia desempeña un papel en las reducciones de nivel. Llamaré como 
siempre fórmula elemental a la que consta de un predicado y el número jus- 
to de términos (Gentzen dice Primformel). 

Igual que en el cálculo del Apéndice IX.G, las fórmulas del cálculo se 
organizan en secuentes. Un secuente está formado por dos listas finitas (posi- 
blemente vacías) de fórmulas separadas por comas; entre las dos listas va el 
signo >=. Tal como en el Apéndice IX.G, llamo prefórmulas a las fórmulas 
que preceden a >- y posfórmulas a las que le siguen. A diferencia del cálcu- 
lo estudiado allí, cada secuente puede contener más de una posfórmula. Un 
secuente sin variables libres es inválido (1) si todas sus prefórmulas son ver- 
daderas y todas sus posfórmulas son falsas en cualquier interpretación en 
que la constante 1 designa el primer número natural y el término T' designa 
el siguiente del número designado por t; (11) sí no tiene prefórmulas ni pos- 
fórmulas, esto es, si se trata del secuente “vacío”. En cualquier otro caso, el 
secuente es válido. En otras palabras: la conjunción de las prefórmulas de 
un secuente válido garantiza la disyunción de las posfórmulas. 

Hay seis símbolos lógicos. Como acabo de indicar, el signo >- separa las 
prefórmulas de las posfórmulas en un secuente. Los otros cinco —que, imi- 
tando a Gentzen, llamaré conectivos (él dice Verkniipfungszeichen)— son la 
negación —, la conjunción a,” la disyunción v y los signos de cuantificación 
Y y 3. Dichos conectivos tienen su significado habitual. Las fórmulas no 


Para ajustarnos estrictamente al CP1 tendríamos que elegir dos predicados binarios, diga- 
mos P? y P?, y estipular que (1, = 1,) abrevia a P?%,1t, y (t, > 1,) abrevia a P?,1,T). 
Fuera de = y >, veo un predicado más, el predicado ternario íx es congruente con y 
módulo z”, que se utiliza una sola vez, en la fórmula *1”” = 1 (mod 1”), presentada 
como ejemplo ilustrativo (Gentzen 1938, p. 23, al final del $1.4). 


En vez de A, Gentzen usa % como signo de conjunción. 


Conviene, sí, tener presente la siguiente advertencia de Gentzen (1935, p. 526): si VIÑ(1) 
es una fórmula con un solo cuantificador y sin otra variable que r, “no tenemos que 
asociar a ese V la representación de una cantidad infinita cerrada de aseveraciones 
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elementales se construyen a partir de las elementales, mediante conectivos y 
paréntesis, tal como en el CP1. 

Para construir los secuentes y las derivaciones se requieren tres nuevos 
signos de puntuación: la coma, que separa dos prefórmulas o dos posfórmulas 
de un secuente; el espacio, que separa dos premisas de una inferencia, y la 
raya horizontal, que va en cada inferencia entre la o las premisas y la con- 
clusión. El espacio que es un signo de puntuación del cálculo se distingue 
de otros blancos en la página porque deslinda a derecha e izquierda con 
secuentes y abajo con una raya.? (A diferencia de lo que ocurre en nuestro 
Apéndice IX.G, el espacio y la raya no son aquí signos auxiliares introduci- 
dos para facilitar nuestra presentación en castellano de las reglas de inferen- 
cia, sino que forman parte de las derivaciones y contribuyen a determinar su 
estructura; son, pues, signos del cálculo). 

Una inferencia (Gentzen dice Schluffigur, “figura de inferencia”) consta 
de uno o dos secuentes escritos sobre una raya horizontal y un secuente escrito 
bajo esa raya. Aquéllos son las premisas; éste la conclusión (Gentzen los 
llama Obersequenzen —“secuentes de arriba”— y Untersequenz —“secuente 
de abajo”—, respectivamente). Cada inferencia se ajusta a uno de los veinte 
esquemas presentados a continuación. Siguiendo a Gentzen, represento me- 
diante una mayúscula griega una fila —posiblemente vacía— de fórmulas 
separadas por comas; mediante una mayúscula gótica, una fórmula cualquie- 
ra; la minúscula gotica t representa un término cualquiera, las minúsculas 
góticas (1 y E representan variables, y los signos lógicos y de puntuación están 
representados homónimamente por ellos mismos. F(t/x) es la fórmula que 
se obtiene al reemplazar la variable x por el término t en todas las posicio- 
nes donde t está libre en ¿7 (cf. Apéndice IX.A, p. 485). La variable repre- 
sentada en algunos esquemas por la letra a está sujeta a las restricciones que 
se indican; Gentzen la llama la variable propia (Eigenvariable) de la infe- 
rencia respectiva. En la inferencia estructural llamada corte, las fórmulas 


particulares, sino que podemos concebir su sentido “finitamente” (“finit”) así: “Si la x se 
reemplaza sucesivamente por números, empezando con el 1, entonces, por mucho que 
se avance en la formación de números, se obtiene en cada caso una aseveración verda- 
dera”.” 

Si esta caracterización no parece suficientemente precisa, se puede reemplazar el espa- 
cio entre premisas por un signo impreso, por ejemplo, el punto y coma. 
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iguales, representadas con D, son las fórmulas cortadas en el corte. En las 


inferencias con conectivo, la fórmula con conectivo destacada en la conclu- 
sión es la fórmula principal de la inferencia. 


ESQUEMAS DE LAS INFERENCIAS ESTRUCTURALES!" 


Debilitamiento r>—0 r>—0 
D,IrT>0 r>-0,9D 

Contracción D,D,Ir>0 r>-0,9,9 
D,Ir>0 r>-0,9D 

Permutación AD, E, >0 T>0,D,€,A 

AE,DI>0 T>0,E,D,A 
Corte r>-0,9D DAA 
BDA>0,A 


A la inferencia estructural que llamo debilitamiento, Gentzen la llama Verdiinnung, esto 
es, “dilución” o “desleímiento” (“thinning” en la traducción inglesa de Szabo); pero, como 
luego señala, “un “desleímiento” representa tan sólo un debilitamiento (Schwdchung) 
del sentido sustantivo de un secuente” (1938, p. 31; cursiva en el original). 
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ESQUEMAS DE LAS INFERENCIAS CON CONECTIVOS 


V 


Tr=, Y Pb AT >0 B,T>0 


T>0,A1Y AYvB,>0 


r>0, YA r>0,Y 


A,T>0 B,T>0 


AABT >0 AABO>O |T>-O0 Avd T>-0AvYD 


T > 0, 3(a/x) S(a/x), T > O 


11Y,T >0 


T > 0, VIF 


si la variable a no figura en la conclusión | si la variable a no figura en la conclusión 


S(t/x), T > 0 T > 0, 3(/1) 


VIF,T>0 T > 0, 11% 


Tr > 0,2 


—A,T > 0 
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ESQUEMA DE LAS INFERENCIAS INDUCTIVAS 


IM S(a/x), T > O, Y(1/X) 
SA/x), T > O, FU/X) 


si la variable a no figura en la conclusión 


Como puede verse, éste último esquema autoriza la inducción matemática 
ordinaria como procedimiento normal de inferencia dentro del cálculo. El 
lector debe cerciorarse de que los otros 19 esquemas llevan en todo caso de 
premisas válidas a conclusiones válidas. 

Una derivación es una colección finita secuentes, separados por rayas hori- 
zontales o espacios, con las propiedades que se enumeran a continuación. 


(1) Cada raya horizontal separa las premisas de la conclusión de una 
inferencia ajustada a uno de los 20 esquemas. 
(11) Hay un y sólo un secuente final que no está sobre ninguna raya (no 


es premisa de una inferencia). 
(111) Hay uno o más secuentes iniciales que no están bajo ninguna raya 
(no son conclusiones de inferencias). 
(iv) Los secuentes iniciales pertenecen a una de las dos clases de secuentes 
básicos, definidas a continuación: 
(a) si $ es una fórmula cualquiera, ¿Y > Y es un secuente básico 
lógico (un SBL); 
(b) si ' y A son listas finitas (no vacías) de fórmulas elementales, 
el secuente I' > A es un secuente básico matemático (un SBM) si 
todo secuente obtenido reemplazando uniformemente cada varia- 
ble en P' y A por un término numérico es un secuente válido. 


Según esto, una derivación puede considerarse como un árbol finito de 
secuentes, ordenado parcialmente por la relación x < z definida recursivamente 
como sigue: x < z (1) si x es una premisa y z es la conclusión de una misma 
inferencia o (11) si hay en la derivación un secuente u tal que x<u y u<z. 
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El Apéndice XVIII contiene varios ejemplos de derivaciones que el lector 
puede examinar a la luz de lo que llevamos dicho. 

En la caracterización de las derivaciones el único ingrediente que requie- 
re una explicación es la definición de los SBMs. Para apreciar su alcance, 
conviene distinguir entre SBMs con y sin variables. Como ya indiqué, todos 
los predicados del cálculo son decidibles. Por lo tanto, si I” y A son listas 
finitas de fórmulas elementales sin variables, habrá un algoritmo para deci- 
dir si el secuente I' > A es válido o no, esto es, si l'” > A es o no un SBM. 
Pero si hay una o más variables en I' o en A, tal decisión es generalmente 
impracticable, ya que las sustituciones posibles de esa o esas variables por 
términos numéricos no pueden completarse en un número finito de pasos y 
la validez del secuente no puede certificarse sin ensayarlas todas. Como los 
SBMs operan, en rigor, como axiomas del cálculo, éste no es lo que llama- 
mos un cálculo efectivo. Ello no obstaculiza la tarea que Gentzen se ha pro- 
puesto. Al contrario: mientras más poderoso sea un cálculo, mayor es el riesgo 
de que sea inconsistente. Por eso, la generosa aceptación de toda clase de 
axiomas aritméticos, decidibles o no, realza el valor de la prueba de consis- 
tencia. 


2.12.2 Reducciones 


El sistema deductivo descrito es inconsistente si y sólo si permite derivar 
el secuente vacío * >  ”, que no tiene prefórmulas ni posfórmulas. En 
efecto, si * >- ”esel secuente final de una derivación y % es una fórmula 
cualquiera, hay una derivación cuyo secuente final es * > An YA; esta 
derivación se obtiene simplemente añadiendo una raya horizontal y el secuente 
* >= YA n A? bajo la derivación anterior. (La inferencia añadida 


es una inferencia estructural por debilitamiento). Por otra parte, si * > A” 


¿ 


y * > —%(” son los secuentes finales de dos derivaciones del cálculo, se las 
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puede unir en una derivación cuyo secuente final es * >  ”: 
=3l 
> 2 A > E) 
+ (corte) 


Llamaré, por eso, fatal (entiéndase: para la consistencia del cálculo) a cual- 
quier derivación cuyo secuente final es * >= ”.!! Probaremos que no puede 
haber una derivación fatal. En la prueba se usarán algunos términos que defino 
a continuación. 

Si una fórmula empieza con un conectivo, éste es el conectivo principal 
de esa fórmula; si empieza con un paréntesis, su conectivo principal es el 
conectivo cuyo alcance incluye el signo que sigue inmediatamente a este 
paréntesis. !? 

El grado de una fórmula es el número de conectivos que contiene. El grado 
de un corte es el grado de las fórmulas cortadas en él (representadas por D 
en el esquema). El grado de una inferencia inductiva es el grado de la fór- 
mula a que se refiere la inducción (representada por ¿y en el esquema). 

Sea A una derivación cualquiera. Decimos que el secuente o precede inme- 
diatamente en Á al secuente o' (y que o” sigue inmediatamente a 0) si O es 
una premisa de una inferencia en Á cuya conclusión es o”. Si o <a” (en el 
sentido definido en 2.12.1), decimos que o precede a c' o que está sobre c' 
y que o” sigue a G O está bajo o. 

Asignaremos una altura a cada secuente o en la derivación A. Para ello, 
atendemos al grado de cada corte e inferencia inductiva cuya conclusión está 
bajo o en A. El mayor de esos grados es la altura de o en A. Este número 
se utiliza luego de un modo decisivo al ordenar las derivaciones. 


Gentzen la llama Widerspruchsherleitung, esto es, “derivación de una contradicción”. 
El término es correctísimo, pero el equivalente castellano es demasiado largo para usarlo 
a cada momento. La versión inglesa dice “contradictive derivation”, lo que sugiere fal- 
samente que habría un vicio lógico en la derivación misma. 

Para que esta definición sea aplicable hay que suponer escritos todos los paréntesis 
que convencionalmente omitimos; por ejemplo, 'A a B” es propiamente “(A a B)'. El 
alcance de los conectivos está definido en el Apéndice IX.L 
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Un hilo en la derivación A es una lista de secuentes (0,,...,0,) que fi- 
guran en A, cada uno de los cuales precede inmediatamente al siguiente (en 
otras palabras, si 1 <k <n, G, aparece en Á como premisa de una inferen- 
cia cuya conclusión es G,,¡). Diré que el hilo (o ,,....,0,) es un hilo com- 
pleto en Á si o, es un secuente inicial en Á y o, es el secuente final de A.!* 
Consideremos ahora todos los hilos en la derivación Á que (i) contienen el 
secuente final y (11) no contienen ninguna inferencia con conectivo. La unión 
de todos estos hilos constituye un árbol de secuentes que es una parte — 
generalmente, una parte propia— de la derivación entera. Lo llamaremos, 
con Gentzen, el trozo final (Endstiick) de la derivación A. 

Supongamos que Á es una derivación fatal. Con este supuesto, construire- 
mos otra derivación fatal A* diseñada de modo que preceda a A en el orden 
que se definirá en la Sección 2.12.3 (en cierto modo no enteramente obvio, 
A* es más simple que A). 


Eliminación de las variables libres ociosas. Podemos suponer, sin pérdida 
de generalidad, que A no contiene ninguna variable libre que no sea la va- 
riable propia de una inferencia. En efecto, las variables libres que no tienen 
éste carácter no contribuyen en nada a una derivación y pueden todas reem- 
plazarse, digamos, por la constante 1 sin que ello afecte la corrección de la 
inferencias. Podemos asimismo suponer que, si a es la variable propia de 
una inferencia 4 en A, a no es la variable propia de ninguna inferencia si- 
tuada sobre $. En efecto, si a es también la variable libre de otra inferencia 
S" situada sobre 4, se la puede reemplazar en todas las posiciones que ocu- 
pa sobre la conclusión de 4? por una variable nueva —que no figure en toda 
la derivación— sin afectar la corrección de las inferencias. (Recuérdese que 
la variable propia de una inferencia no puede figurar en la conclusión de esa 
inferencia). 


Eliminación de las inferencias inductivas en el trozo final. Sea £ el trozo 
final de la derivación A. Por definición, Z sólo puede contener inferencias 
estructurales o inductivas. Supongamos que contiene una o más inferencias 
inductivas. Elijamos una bajo la cual no haya otra inferencia de esa clase. 


19 Gentzen (1938, p. 24) define “hilo” (Faden) en los términos que he utilizado para de- 


finir un “hilo completo”, pero luego emplea el término “hilo” como si lo estuviera en- 
tendiendo de acuerdo con mi definición. 
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Ella tiene la forma 

Sax), T > O, F(A/1) 

8(/x), P > O, SUL) 


donde n es un término numérico. Sea n % 1 (el caso n = 1 se examina en la 
nota 16). La conclusión no puede contener ninguna variable libre, porque 
bajo ella no hay ninguna inferencia con variables propias.'* Para facilitar las 
referencias, llamo E al trozo de A formado por esta inferencia inductiva y 
todo lo que hay sobre ella. Obviamente, E constituye por sí misma una de- 
rivación cuyo secuente final es F(1/x), T > 0, F(G1/x). Ahora bien, este se- 
cuente se puede derivar mediante inferencias estructurales de las premisas 
38(1/0, T > 0, 301); 31/10), T > O, $0"/1); $0"/1), T > O, $0""/r); 

¿3 Gl/r), PF > O, F(1/1) (donde n-1 representa el término numérico 
que tiene un signo ' menos que el representado por 1), como indica el si- 
guiente esquema parcial, 


3(0/x), T > 0, F/X) 30'/0), T > 0, 31/10) 
SUW/x), T,T > 0,0, 5(/0) (corte) 
30 /x), T > 0, S0A"/x) 30"/p), T > 0, 30"/1) 
SA/1), MA, do O, O, SO" /x) (corte) 
S1/x), T > O, Fx) (corte) 


donde las rayas dobles representan contracciones y permutaciones y la cons- 
trucción continúa en forma similar en el trecho entre los últimos dos cortes. 


14 En el trozo final no hay inferencias con variables propias de los tipos W o 3, ni 


inferencias tipo IM bajo la elegida. 
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Llamaré premisas iniciales del esquema a los secuentes de la forma 
SGu/z), T > O, S(1U/r) 

que en él son premisas sin ser conclusiones. En la derivación A, la premisa 
S(a/x), T > O, Y(A/1) de la última inferencia inductiva es el secuente final 
de una derivación H (H es igual al trozo de A que llamé E, quitando la 
última raya horizontal y el secuente bajo ella). En H la variable libre a no 
es la variable propia de ninguna inferencia.'* Por lo tanto, se la puede reem- 
plazar uniformemente por un dado término numérico, sin afectar la corrección 
de las inferencias. Sea H(m/a) la derivación obtenida al reemplazar la variable 
a por el término numérico m en todas las posiciones libres de 4 en H. Reem- 
placemos en el último esquema, la premisa inicial F(1/x), T > 0, FA'/1) 
por H(1/a), la premisa inicial 3(1'/x), T > 0, 30”/x) por H(1'/a) y, en 
general, cada premisa inicial de la forma y(m/x), PT > O, FG /x) por H(m/ 
a). El producto de este reemplazo es una derivación que llamaré E.. Si 
reemplazamos en A el trozo E por E, obtenemos una derivación fatal A, 
que contiene una inferencia inductiva menos que A.!? Repitiendo este 
procedimiento un número finito de veces se obtiene una derivación fatal A? 
que no contiene ninguna inferencia inductiva en su trozo final. 


Alianza de fórmulas en una derivación. Nuestro próximo paso será mostrar 
que, si A? es una derivación fatal que sólo contiene inferencias estructurales 
en su trozo final, hay una derivación fatal A* que no contiene debilitamien- 
tos ni secuentes básicos lógicos (SBLs) en su trozo final. Pero antes definiré 
un concepto que luego nos será muy útil. Es una relación que agrupa fórmu- 
las iguales (copias de una misma fórmula) en lugares diferentes en una de- 
rivación; esto es, una relación entre fórmulas situadas (marcadas, si se quie- 
re, con un índice de su posición). En una inferencia estructural hay, por re- 


e De otro modo, a sería la variable propia de la inferencia elegida y de otra inferencia 
que la precede. Esto contradiría nuestra suposición inicial sobre la unicidad de las va- 
riables propias. 

e Consideremos ahora el caso —que arriba dejé de lado— en que el término numérico n 
en la conclusión de la última inferencia inductiva de A es la constante 1. Entonces, esa 
conclusión puede derivarse del SBL (1/1) > (1/2), por debilitamientos y permu- 
taciones. Llamemos E, a esta derivación trivial. Reemplazando el trozo E por esta de- 
rivación E, se obtiene una derivación fatal que contiene una inferencia inductiva me- 
nos que la derivación A. 
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gla general, grupos de fórmulas situadas que consideramos homólogas; por 
ejemplo, las tres fórmulas representadas por la letra D en los esquemas de 
la contracción, las dos representadas por D en los esquemas de permutación 
y corte, las dos representadas por (6 en los esquemas de permutación; pero 
también las fórmulas que ocupan la misma posición (primera, segunda,...., 
enésima) en las dos copias de la lista de fórmulas representada en un esque- 
ma por cierta mayúscula griega. Diré que dos fórmulas iguales que ocupan 
lugares diferentes en una derivación están aliadas si figuran en la misma 
inferencia y son homólogas en el sentido indicado. Sea Y una fórmula situa- 
da en el trozo final Z de una derivación A. La alianza de Y en A es el 
conjunto 4; de fórmulas situadas en Z caracterizado así: (1) Ye Az; (11) si 
ye Az y 33, está aliada a Y, Y, e Az.!” Ahora bien, si A es una deriva- 
ción fatal, es claro que 4; contiene las dos fórmulas cortadas en un corte. 
En efecto, toda fórmula de 4; que no sea una de las fórmulas cortadas en 
un corte está aliada a una fórmula del secuente que sigue inmediatamente al 
suyo. Como el secuente final de A no contiene fórmulas, Z tiene que incluir 
un corte —y sólo uno!'*— cuyas fórmulas cortadas sean copias de Y y per- 
tenezcan a 4. Lo llamo el corte propio de la alianza 4. Todas las fórmu- 
las de la alianza 4, están situadas sobre la conclusión de su corte propio. 
Distinguimos el lado izquierdo de A;, formado por copias de ¿y situadas en 
hilos que terminan en la primera premisa del corte propio, y el lado derecho 
de A4;, formado por copias de Y situadas en hilos que terminan en la segun- 
da premisa del corte propio. Se advertirá que todas las fórmulas del lado 
izquierdo son posfórmulas de sus respectivos secuentes, y que todas las del 
derecho son prefórmulas. Cada lado de la alianza tiene la estructura de un 
árbol cuya raíz es una de las dos fórmulas cortadas en el corte propio. Éste 
se ramifica dondequiera haya copias de ¿y aliadas en la premisa de una con- 
tracción. Si un elemento de un lado es la fórmula agregada en la conclusión 
de un debilitamiento o pertenece a un secuente inicial de la derivación, de- 
cimos que es una fórmula inicial de ese lado y de la alianza 4. 


“Aliada” y “alianza” corresponden, respectivamente, a los términos “gebunden” y *Bund”, 
empleados por Gentzen. La traducción inglesa dice *clustered” y “cluster”. 

Si hubiera dos, uno precedería al otro; pero las fórmulas cortadas en un corte no pue- 
den pertenecer a una alianza que incluya fórmulas situadas bajo las premisas de ese 
corte. 
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Eliminación de los debilitamientos y los secuentes básicos lógicos en el tro- 
zo final. Ahora procederemos a eliminar los debilitamientos y los SBLs del 
trozo final Z? de la derivación fatal A“. 

Sea 9 un debilitamiento que figura en Z?, sobre el cual no hay ningún 
otro debilitamiento en Z?. Sea ¿y la fórmula agregada en la conclusión de 9. 
Para formar una nueva derivación fatal que no contenga la inferencia Y sim- 
plemente eliminamos la conclusión de Y y todas las copias de Y que com- 
ponen la alianza 4. Dos casos merecen atención. (i) Puede haber dos co- 
pias de ¿y aliadas en la premisa de una contracción; al borrarlas junto con su 
aliada en la conclusión, la nueva conclusión resulta ser una copia de la nue- 
va premisa y, por ende, se la puede eliminar completamente (la contracción 
desaparece). (ii) El corte propio de 44, contiene una copia de ¿y que no está 
al mismo lado que ¿y; esa copia se elimina junto con el secuente a que per- 
tenece y todos los secuentes situados sobre él; la otra copia de ¿y en el corte 
propio de 4; se borra simplemente (como las demás en su lado); la conclu- 
sión del corte se infiere de la premisa sobreviviente por debilitamientos y 
permutaciones, como se verá comparando los esquemas siguientes. 


Tr>-0,9D A, D>A r>—0 
PA>0,A PA>0,A 


Reflexionando sobre los esquemas de las inferencias estructurales el lector 
se persuadirá de que el producto de la transformación a que A” ha sido so- 
metida también es una derivación fatal, que contiene un debilitamiento me- 
nos que A”. Repitiendo el mismo proceso un número finito de veces, se 
obtiene una derivación fatal A*” que no contiene debilitamientos en su trozo 
final Z**. 

Si Z? contiene uno o más SBLs, elijamos uno que represento con Y > 
2. Como el secuente final no contiene fórmulas, A > Y tiene que ser la 
premisa de una inferencia. No puede serlo de una permutación ni de una 
contracción. Por lo tanto, tiene que ser una de las premisas de un corte. 
Entonces la conclusión de ese corte será igual a la otra premisa, como se ve 
en los esquemas siguientes. 
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A > Y A, A > A r>0 A > A 


Es posible, pues, eliminar el corte, borrando el SBL Y > A e identificando 
la conclusión con la otra premisa, sin detrimento de las demás inferencias. 
Repitiendo este proceso se eliminan en un número finito de pasos todos los 
SBLs contenidos en el trozo final de la derivación A*?, 


Reducción del conectivo. Hemos demostrado que si existe una derivación fatal 
A, también hay una derivación fatal A* cuyo trozo final Z* no contiene 
variables libres, inferencias inductivas, debilitamientos o secuentes básicos 
lógicos. Si A* no contiene ninguna inferencia con conectivo, A* coincide 
con su trozo final. Las características de A* implican, en tal caso, que todos 
sus secuentes iniciales son secuentes básicos matemáticos (SBMs). Estos 
constan exclusivamente de fórmulas elementales. Como no contienen varia- 
bles libres —puesto que A* no las contiene— dichos secuentes expresan 
verdades aritméticas decidibles. Evidentemente, el secuente * >- ” nose 
puede derivar de tales secuentes mediante cortes, contracciones y permu- 
taciones. Por lo tanto, si AY es una derivación fatal, A* contiene al menos 
una inferencia con conectivo. Voy a mostrar que en tal caso existe una deri- 
vación fatal A* que precede a A* en el orden que definiremos en la Sección 
2.12.3 (como allí se verá). Llamaré a la transformación de A* en A! la re- 
ducción del conectivo —ya que Gentzen la llama Verknipfungsreduktion— 
pero ella no envuelve la eliminación de un conectivo; la preposición “de” 
significa aquí “concerniente a”. 

El trozo final Z* de la derivación A* está formado por hilos que conver- 
gen en el secuente final * >- ”. Algunos de esos hilos pueden empezar — 
por arriba— con SBMSs que no contienen variables libres, pero al menos uno 
de ellos empieza con la conclusión de una inferencia con conectivo, cuya 
premisa o premisas quedan, por definición, fuera de Z*. Si hay varios hilos 
de esta clase, asignamos un gódel a cada uno y elegimos el de numeración 
más baja, que llamaré h. Sea $ la fórmula principal de la inferencia con 
conectivo cuya conclusión constituye el extremo superior del hilo elegido. 
Diré que % es la fórmula crítica de la reducción. Consideremos la alianza 
A que $ forma dentro de Z* con otras fórmulas iguales a ella. En el corte 
propio de 4, las fórmulas cortadas son copias de 5. Por lo tanto, la premi- 
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sa de dicho corte que no está en el hilo h, pertenece a otro hilo gy cuyo 
extremo superior también es la conclusión de una inferencia con conectivo. 
(De otro modo, dicha premisa pertenecería sólo a uno o más hilos comple- 
tos contenidos enteramente en el trozo final Z*, que no contiene debilita- 
mientos ni SBLs, y por ende no podría contener una fórmula con un 
conectivo). Para fijar ideas, supongamos que V es el conectivo principal de 
la fórmula crítica de la reducción. Entonces la derivación fatal A* contiene 
el trozo representado esquemáticamente en el Cuadro 1: 


CUADRO 1 
[h] ; . 19] 
P, > 0,, X(a/x) 3/1), P, > O, 
T, > 0,, VIS VIS, IT, > 0, [a] 
T > 0, VIS VIV, A> A 
NA>0O,A [b,] 
T, 3 O, [c,] 
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Las líneas punteadas sobre los primeros secuentes anotados representan las 
ramas de A* que confluyen en los hilos h y 9, respectivamente. Cualquier 
otra línea punteada vertical representa la continuación de h y g entre los 
dos secuentes que enmarcan esa línea. Las líneas punteadas inclinadas que 
salen de una misma vertical representan los hilos —0, 1, 2 o más— que 
desembocan en el representado por ésta, entre los dos secuentes que la 
enmarcan. El término n en la premisa de la inferencia con conectivos al lado 
derecho tiene que ser un término numérico, ya que esa no es una inferencia 
con variable propia y no hay otras inferencias con variable propia bajo ella.2 
He escrito [a,] frente a las dos conclusiones de inferencias con conectivo 
con que empiezan los hilos h y 9; [b,] frente al corte propio de la alianza 
de la fórmula VI, y [c,] frente al primer secuente bajo dicho corte cuya 
altura es menor que la altura de las premisas de ese corte (tiene que haber 
un secuente así, puesto que el secuente final tiene altura 0).?! Este secuente 
puede ser la conclusión de ese corte, en cuyo caso las líneas marcadas con 
[b,] y [c,] coinciden. También puede ocurrir que las premisas del corte sean 
las conclusiones marcadas con [a,] y que su conclusión sea el secuente final 
* >”, Estas situaciones especiales simplifican la reducción del conectivo 
sin afectarla. 

La reducción del conectivo Y en la posición indicada transforma la deri- 
vación A* en la derivación A* presentada esquemáticamente en el Cuadro 2 
(p. 456). Las líneas punteadas marcadas con [h] y [9] representan sendas 
copias de los árboles marcados del mismo modo en el Cuadro 1. Se ha in- 
vertido el orden para acomodar dos árboles nuevos marcados [h'] y [g'] que 
se combinan en cortes con la continuación de [h] y [g], como se indica en 
la línea [c,]. Hasta la línea [a,], [g/] es simplemente una copia de [g] y [h'] 
es el resultado de reemplazar en [h] la variable a, en todas sus posiciones 
libres, por el término numérico 1. Bajo la línea [a,], [h'] y [g'] se continúan 
con permutaciones y un debilitamiento para obtener las conclusiones que 
ocupan la línea [b,]. La línea [d,] contiene los primeros secuentes cuya altu- 


z0 Según acordamos arriba, la derivación entera no contiene variables libres que no sean 


variables propias de una inferencia. En virtud de la eliminación de las inferencias 
inductivas en el trozo final, éste no contiene ninguna inferencia con variable propia. 


21 Recuérdese que la altura de un secuente en una derivación es el más alto grado poseí- 


do por un corte o inferencia inductiva cuya conclusión está bajo ese secuente. 
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ra es inferior a la de las premisas del corte respectivo en la línea [c,] ([d,] 
corresponde pues a [c,] en el Cuadro 1). Los secuentes de la línea [e,] se 
derivan por cero, una o más permutaciones de sus respectivos predecesores 
en la línea [d,]. La línea [f,] contiene la conclusión de lo que llamaremos 
con Gentzen el nuevo corte. La línea [2,] se deriva de [f,] mediante contrac- 
ciones y permutaciones. Las rayas horizontales dobles representan, pues, cero, 
una o más inferencias estructurales triviales, según haga falta en cada caso.?? 
A la luz de estas indicaciones es fácil ver que A' es una derivación genuina. 
Aunque, a primera vista, A parece más compleja que A*, una mirada más 
atenta descubre sutiles simplificaciones. El corte propio de la alianza de Vr Xt 
en A*, marcado con [b,], es en cierto sentido homólogo a los cortes marca- 
dos con [c,] en A'; pero sobre cada uno de estos cortes hay una inferencia 
con conectivo menos que sobre el corte propio de la alianza de VrxFr en 
A*. En otro sentido, al corte propio de la alianza de Vr xr en A* le corres- 
ponde en A' el nuevo corte (entre las líneas [e,] y [£,]); pero el grado de 
éste —esto es, el número de conectivos en las fórmulas cortadas— es menor 
que el de aquél. Como pronto veremos, el orden que Gentzen establece en- 
tre las derivaciones está pensado para aprovechar estas diferencias. 

Si el conectivo principal de la fórmula crítica de la reducción no es V 
hay que modificar algunos detalles de la transformación. Si es », la fórmula 
crítica tiene la forma A » Y. Entonces, en el esquema de la derivación A* 
la inferencia con conectivo al lado izquierdo tendrá la forma 


Tr, > 0, A Tr, > 0, Y 
r,>0,YAnrB [a] 


y la inferencia con conectivo al lado derecho tendrá una de las formas 


Y, TP, > O, %B, TP, 3 O, 
Ya BD, T, 0, Ya Y, TP, > O, [a] 


Puede ocurrir que el secuente que precede inmediatamente a un par de rayas tenga ya 


la forma del secuente que inmediatamente las sigue; en tales casos, se sobreentiende 
que la derivación no contiene dichas inferencias y que hay un solo secuente donde el 
esquema presenta dos. 
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Bajo la línea [a], hallaremos también A a Y en lugar de VI y una de las 
fórmulas A o Y en vez de (1/1). La derivación A' se ajusta facilmente a 
estos cambios (ensáyelo el lector). En particular, el árbol marcado [h'] con- 
tiene sobre la primera raya horizontal solamente una derivación del secuente 
A, TP, > O, (respectivamente, Y, P, > 0,). 

Si el conectivo principal de la fórmula crítica de la reducción es —=, las 
dos inferencias con conectivo en el esquema de la derivación A* tendrán la 
forma 


A, T,>0, T,>0, A 
E, +0, Y Ll, E, > O, [a] 
En la derivación A'* los árboles designados con [h'] y [g] deben ir a la de- 


recha de los designados con [h] y [g']. Las partes superiores de [h'] y [g'] 
tienen la forma 


[91 . 1 
T, > 0, A A, T, > 0, [a] 
91, TP, > 0, A A, T, > 0, 9 [b] 


El lector debe hacer los cambios correspondientes en el resto del esquema 
que representa a A' y verificar que el resultado es una derivación genuina. 
Dejo también a su cuidado el caso de los dos conectivos restantes, que re- 
solverá sin dificultad aprovechando las relaciones de dualidad entre v y A y 
entre V y 3. (Cambie las prefórmulas en posfórmulas y viceversa y ponga a 
la derecha el árbol de la izquierda y a la izquierda el de la derecha). 
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2.12.3 Orden de las derivaciones e inducción transfinita 


Gentzen ordena las derivaciones asignándole a cada una un elemento de 
una colección bien ordenada de objetos definidos por él. Aunque los llama 
“números ordinales” (Ordnungszahlen) y los designa con símbolos tomados 
de Cantor, Gentzen advierte que esos símbolos y las operaciones con que 
los combina “han de entenderse para nuestros propósitos de un modo ente- 
ramente formal, sin que haya que atribuirles ningún sentido, como que wm es 
“un número infinito” y el signo *+” representa la “adición”” (1938, p. 38). 
Luego diré algo sobre el sentido y los méritos de esta advertencia. Pero aten- 
damos primero a la definición de los ordinales de Gentzen. 

Gentzen define recursivamente una secuencia infinita S,, S,, S,, ... de 
“sistemas”, y relaciones de igualdad (=) y de orden (>) entre los objetos que 
los forman. El sistema So consta de un solo objeto, llamado O. En So las 
dos relaciones mencionadas se definen por las condiciones: (1) O = 0 y (ii) 
es falso que O > 0. Supongamos ahora que ya se ha definido la composición 
del sistema S,, así como las relaciones de igualdad y orden en O, (n e 
N).2 Entonces, el sistema S,,,, comprende (i) el O y (ii) todos los objetos 
de la forma 


0% +0%+...+ 0% (*) 
donde me ÑN, Q;, 0), ..., A, pertenecen a O, y Ay >, > ... > Oy. Las 
ys 


relaciones de igualdad y orden en €,,,, se definen así: Sean a = 0% + 0% 

+... +0%yPB=0P* + 0P +... + 0 elementos de S,,, (p < q); entonces 

(a) a=Bsi y sólo sip =q y Aa =P, (l < k< q); 

(b) a>fPsia,=fB, para todo ¡<k<q,a,+*Pya,>B, o siar=B; 
para todo k<qyq<p; 

(c) 0aA>0, a menos que a = 0. 


2 Gentzen escribe: “Die Zahlen des Systems 8, (p sei eine natiirliche Zahl oder 0) seien 


bereits definiert, ebenso = und <-Beziehung zwischen diesen” (1938, p. 38). Tendré 
ocasión de referirme a este pasaje al final de esta sección. 
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Como de costumbre, si a > PB (en palabras: a. es mayor que |), decimos 
también que $ < a (en palabras: $ es menor que a). Es claro que si a. y B 
pertenecen a S,,,, se cumple una y solo una de las tres condiciones siguien- 
tes: a>fPB,a=poa< BP. 

Los ordinales de Gentzen son los elementos de los sistemas So Ss 
S,, . .. Como el lector puede fácilmente verificar, si n y m son dos núme- 
ros naturales tales que n es menor que m, S, está incluido en S,,. La inyec- 
ción canónica OS, > S,,, x > x obviamente preserva las relaciones de igual- 
dad y orden. Es obvio asimismo que, dada una expresión cualquiera, es po- 
sible decidir efectivamente si posee o no la forma (*) y, por lo tanto, si es O 
no un ordinal. Dadas dos expresiones de la forma (*) es posible decidir 
efectivamente si son o no iguales, y en caso que no lo sean, cuál de las dos 
es mayor. (También, por cierto, si una de las expresiones dadas es el 0). Por 
lo tanto, todos estos conceptos son “finitistas” (“finit”) en el sentido de 
Hilbert, concluye Gentzen (1938, p. 38). Con todo, la misma notación adop- 
tada conduce inevitablemente a establecer una correspondencia biunívoca entre 
los ordinales de Gentzen y un segmento de los ordinales de Cantor, como 
sigue: 0>0,0>1,00+0>2,...,01>0,0 1 +0>0+1l,... 
En suma, a cada ordinal de Gentzen le corresponde de manera exclusiva su 
homónimo en el sistema de Cantor. Según Gentzen, esta correspondencia se 
introduce —así como la nomenclatura que la sugiere— sólo para facilitar la 
comprensión a los lectores familiarizados con la teoría de conjuntos. Pero es 
mucho más profunda que las analogías y homonimias didácticas habituales. 
La correspondencia es un isomorfismo de órdenes, puesto que la relación > 
entre los ordinales de Gentzen se definió, como es obvio, en armonía con la 
relación *mayor que” entre sus homónimos cantorianos. En virtud del iso- 
morfismo, cada sistema gentzeniano S, (k > 0) corresponde, a un conjunto 
de ordinales cantorianos que también llamaré S,. Tales conjuntos contienen 
los ordinales que se indican a continuación: 


Sy, = (0) 

E, E, UL Dare r= iO) 

6, = 6, Y lo, O0+1, 0+2,... = dx x < 0% 
Sia lex <o"] 

S, = fa x<o0%y 
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Cantor llamó e, al ordinal más pequeño que satisface la ecuación w* = E. Es 
claro, pues, que el sistema ordenado que forman todos los ordinales de 
Gentzen es isomórfico a £,. El isomorfismo permite transferir a los ordinales 
de Gentzen las operaciones de adición, multiplicación y exponenciación 
transfinitas definidas en el Capítulo 1.5. En tal caso, el signo +, no obstante 
la advertencia de Gentzen, funciona precisamente como signo de adición. En 
su exposición, Gentzen aduce la multiplicación y la exponenciación, pero 
advierte enfáticamente que estos conceptos “sirven, por cierto, sólo para 
aclarar las cosas, ya que de ninguna manera están definidos para nosotros” 
(1938, p. 40).?* Por otra parte, introduce formalmente una operación algebraica 
binaria entre sus ordinales, como sigue. Sean a = 0% 0% +...+ 0% y 
PB = 0 + 08 +... + 01 dos ordinales de Gentzen. Entonces la suma natu- 
ral a. ++ fB es el ordinal que se obtiene escribiendo p + q copias de w sepa- 
radas por el signo + y asignándoles los “exponentes” 0L;,..., Ap PBp.-., 
P¿ ordenados de mayor a menor. Evidentemente, la suma natural es una ope- 
ración conmutativa y asociativa. Es fácil probar que (a. ++ B) > a y que si ar 
> a, (a! ++ B) > (a + B).4 En adelante — imitando a Gentzen— llamo 1 al 
ordinal gentzeniano 0% y o a 0). 

Gentzen asigna a cada derivación un ordinal de los suyos mediante el 
procedimiento que paso a explicar. Sea A una derivación cualquiera. Á consta 
de uno o más secuentes y rayas horizontales. Asignamos un ordinal a cada 
secuente y a cada raya, según la posición que ocupa en A (dos copias del 
mismo mismo secuente pueden tener distintos ordinales). Llamo O(o) al 
ordinal asignado al secuente o (en una determinada posición). Si U es un 
secuente inicial, O(c) = 1. El ordinal O(L) de una raya 2 se determina así: 
(1) si A pertenece a un debilitamiento, permutación o contracción cuya pre- 
misa es un secuente o, O(2) = O(o); (11) si A pertenece a un corte con premisas 
5, y 0, O(1) = O(o,) ++ O(o,); (iii) si A pertenece a una inferencia con 


2% Me confieso incapaz de entender cómo un concepto que para nosotros no está definido 


de ninguna manera (gar nicht definiert) puede contribuir a la clarificación (zur Er- 


lduterung dienen). 


25 Como el lector habrá advertido, la suma natural así definida se aplica sólo a los ordinales 


mayores que O. Pero no cuesta nada incluir al O en el dominio de la operación estipu- 
lando que a + O = 0, cualquiera que se aL. Entonces, la condición a. ++ $ > a. se cum- 
ple sólo si B +0. 
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conectivo con una sola premisa o, O(1) = O(o); (iv) si A pertenece a una 
inferencia con conectivo con dos premisas 0; y 07, O0(A1) = max(O(o ¡), O(o,)); 
(v) si A pertenece a una inferencia inductiva cuya premisa tiene el ordinal a 
= 0% +0%+...+0%, 0) = 0%*! (naturalmente, si a, = 0, O(A) = 0! = 
0). Sea c la conclusión bajo la raya A. El ordinal O(c) se determina compa- 
rando la altura h de c con la altura h* de las premisas sobre A. Si h = h*, 
O(c) = 00). Si h= h*- 1, O(c) =0%%, Si h=h*- 2, O(c) = 0%”. Si h 
= h*- 3, O(c) = 0, etc. La utilidad de estas reglas, al parecer capricho- 
sas, se verá en la próxima etapa del razonamiento. Por ahora, basta que el 
lector se convenza, analizando ejemplos, de que ellas asignan unívocamente 
un genuino ordinal a cada secuente de la derivación A. El ordinal O(A) asig- 
nado a la derivación misma es el ordinal de su secuente final. 

En la Sección 2.12.2 se demostró que, si existe una derivación fatal A, 
también existe una derivación fatal A*, construida a partir de A mediante la 
serie de transformaciones que allí se explica. Ahora demostraré que O(A*) < 
O(A), examinando dichas transformaciones una a una. Al leer los próximos 
párrafos conviene tener presentes los párrafos de igual título en la Sección 
2.12.2. 


Eliminación de variables libres ociosas. Dimos por supuesto que Á no con- 
tenía ninguna variable libre que no fuera la variable propia de una inferen- 
cia, ni dos variables iguales que fueran variables propias de dos inferencias 
distintas. Esta suposición no afecta el ordinal O(A). En efecto, si A no cum- 
ple esta doble condición y A” es la derivación fatal obtenida mediante las 
sustituciones de variables descritas bajo este mismo título en la Sección 2.12.2, 
es claro que O(A) = O(A?). 


Eliminación de las inferencias inductivas en el trozo final. Supongamos que 
A contiene inferencias inductivas en su trozo final y que A, es la derivación 
obtenida al eliminar la última de esas inferencias inductivas del modo des- 
crito bajo este mismo título en la Sección 2.12.2. Supongamos que, igual 
que allí, 


S(a/x), T > 0, X(1/1) 


S1/1), T > O, XUL) 
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es la forma de esa inferencia (con término numérico n % 1). Sea 0% + 0% 
+...+0% el ordinal de la premisa. Entonces, el ordinal de la raya horizon- 
tal es 0%*!, Ahora bien, la conclusión tiene la misma altura que la premisa, 
ya que los cortes propios de las alianzas de F(1/x) y Y(1VX) figuran bajo 
ambas y tienen por lo menos el mismo grado que la inferencia inductiva 
considerada. Por lo tanto, w%*! es también el ordinal de la conclusión. En la 
derivación A,, los “secuentes iniciales” del segmento de derivación que sus- 
tituye a la inferencia inductiva eliminada se obtienen reemplazando la varia- 
ble libre a por términos numéricos. Como tales reemplazos no afectan el 
ordinal, esos “secuentes iniciales” tienen todos el mismo ordinal 0% + 1 
+...+0%, Los nuevos cortes que aparecen en A, tienen todos el mismo 
grado que la inferencia inductiva eliminada. Por lo tanto, el ordinal del 
secuente (1/1), FT > O, FG) al final del segmento sustituto es la suma 
natural de los ordinales de dichos “secuentes iniciales” y su primer término 
es 0%, de tal modo que ese ordinal es menor que (w%*!, el ordinal de la 
conclusión de la inferencia inductiva eliminada. Como ahora se verá, esto 
implica que O(A;,) < O(A). En efecto, encontraremos bajo el referido secuente 
S0/x), FT > O, Fur) solamente inferencias estructurales que la transfor- 
mación de A en A, no altera en nada. Los debilitamientos, permutaciones y 
contracciones trasmiten a la conclusión el ordinal de la premisa. Por lo tan- 
to, si no hay cortes bajo dicho secuente, es claro que O(A,) < O(A). Por otra 
parte, un corte cuyas dos premisas tienen ordinales a. y fB trasmite a la con- 
clusión el ordinal a + BP. Si a, <a, (a, + PB) < (a 3 B). Por lo tanto, 
aunque haya cortes bajo el referido secuente, O(A,) < 0(A). En la Sección 
2.12.2 llamé A? a la derivación fatal sin inferencias inductivas en su trozo 
final obtenida eliminando una a una las inferencias de esa clase en el trozo 
final de una derivación fatal cualquiera A. Es posible que A misma no con- 
tenga tales inferencias —en cuyo caso A = A*— pero, si las contiene, su 
ordinal disminuye con la eliminación de cada una. Por lo tanto, O(A%) < O(A). 


Eliminación de los debilitamientos y los secuentes básicos lógicos en el tro- 
zo final. Nos toca ahora mostrar que O(A*) < O(A0), donde A* es la deriva- 
ción fatal sin debilitamientos o secuentes básicos lógicos obtenida por trans- 
formación de AC. Esta fase del razonamiento, aunque elemental, es engorro- 
sa y Gentzen sugiere omitirla si uno se interesa sólo en “lo más esencial” 
(das Wesentlichste—1938, p. 41). Pero en una demostración cualquier fase 
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es igualmente esencial, a menos que sea superflua (en cuyo caso, se la pue- 
de suprimir del todo). La transformación de A' en A* consta de cero o más 
etapas, en cada una de las cuales se elimina un debilitamiento o un SBL. 
Una etapa dada puede envolver la eliminación de un corte o afectar única- 
mente inferencias estructurales que no sean cortes. En este último caso, el 
ordinal de la derivación transformada es igual al de la derivación obtenida. 
Consideremos, pues, sólo el caso especial en que la transformación de Al en 
A* consta de una sola etapa que elimina un corte en el trozo final. Entonces 
puede ocurrir que disminuya la altura de los secuentes situados sobre ese 
corte, no sólo en el trozo final, sino en la derivación entera.?% ¿Qué efecto 
tiene tal reducción de alturas sobre el ordinal de la derivación? Para apre- 
ciarlo mejor, y siguiendo el ejemplo de Gentzen, encaramos el asunto así: 
sea O la premisa del corte eliminado que sobrevive a la transformación; su- 
pongamos que la altura de o cae de h a h-1 y que esta reducción se propa- 
ga, inferencia por inferencia, de conclusiones a premisas, a lo largo de todas 
las ramas de la derivación que quedan sobre u;?” si la altura de o cae de h 
a h—n, entendemos que el proceso se repite n veces; en todo caso, el efecto 
global será el resultado de los efectos locales de la propagación (repetida o 
no). Supongamos, entonces, que el “contagio” ha llegado a la conclusión c 
de cierta inferencia y pasa ahora a sus premisas Tr, y TT, (a T,, Si tiene sólo 
una). Sean a. y P, respectivamente, los ordinales de Tr, y Tr, antes de que 
esto ocurra. Si T, y T, SON secuentes iniciales, a. =f = 1 y no cambian con 
la reducción de altura. Por lo tanto, sólo nos interesa el caso en que T, O T, 
o ambas son conclusiones de inferencias. En tal caso, cuando el “contagio” 
las alcanza, sus ordinales se transforman de a. en 0% y de fB en $. El ordinal 
de la raya horizontal, que, según el tipo de la inferencia en cuestión, era o, 
o a Se B, o max(a+1,B+1), o 0%*! (si se trata de una inferencia inductiva y 
Aa =0% +0% +...+ 0%), se convierte, respectivamente, en 0%, o en 0% ++ 
oP, o en max(o*+1,0P +1), o sigue siendo igual a 1%*!, ¿Qué pasa con el 
ordinal de la conclusión c? Si antes del “contagio” la diferencia de altura 
entre g y Sus premisas era 1, y se ha reducido, por ende, a O, el ordinal de 


26 La reducción de altura ocurre si y sólo si el corte eliminado tenía un grado g mayor 


que el de cualquier otro corte situado bajo él. 


27 La propagación hacia arriba llega hasta la conclusión del primer corte o inferencia 


inductiva con grado g > h, pero no pasa a sus premisas, cuya altura, por cierto, sigue 
siendo g. 
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c después del “contagio” sigue siendo (w%, o se convierte de 0% *B en m2 ++ 
ob, o de max(0%! ÓP+) en max(0* +1,0P +1), o de 0% en 0%*+-+1, En 
cada caso, pues, el ordinal de g es igual o menor que lo que era antes. Otro 
tanto cabe decir si la diferencia entre g y sus premisas era n > l y pasa a ser 
n-1 (verifíquelo el lector). Este análisis demuestra que, cuando ocurre re- 
ducción de alturas en el curso de la transformación de Al en A*, nunca au- 
menta el ordinal de un secuente situado bajo otro cuya altura disminuye. En 
particular, no puede aumentar el ordinal del secuente final, que es el ordinal 
de la derivación. Si la transformación de A% en A* tiene más de una etapa, 
este resultado se aplica a cada una. Por lo tanto, O(A*) < 0(A0). 


La reducción del conectivo. Hemos logrado establecer que, si Á es una de- 
rivación fatal, hay derivaciones fatales A% y A*, con las propiedades señala- 
das, cuyo ordinal es igual o menor que el ordinal de A. Mas para demostrar 
inductivamente que no hay ninguna derivación fatal es preciso comprobar 
que, si hubiera una, existiría también otra cuyo ordinal es estrictamente menor 
que el de la primera. La artificiosa operación que llamamos “reducción del 
conectivo” garantiza justamente este resultado. Como sabemos, esta opera- 
ción tiene que ser aplicable a una derivación fatal con las propiedades de 
A*, si tal derivación existe, porque una derivación así tendría que incluir 
por lo menos una inferencia con conectivo. Atendamos, pues, a la reducción 
del conectivo aplicada al signo de cuantificación V, ilustrada en los Cuadros 
1 y 2 de la Sección 2.12.2. Para facilitar las referencias, marqué allí ciertas 
líneas con letras acompañadas del número del cuadro respectivo. Llamamos 
A* y AY las derivaciones representadas en los Cuadros 1 y 2, respectiva- 
mente. La líneas [c,] y [d,] son las primeras en que aparecen secuentes cuya 
altura es menor que la altura de las premisas de los cortes en [b,] y [c,]. Sea 
a el ordinal de la raya horizontal sobre [c,] y sean B y y los ordinales de las 
rayas horizontales sobre [d,]. Suponemos que $ > y (B puede corresponder a 
la raya de la derecha). Entonces a. > KB > y. Esta desigualdad se basa en lo 
siguiente: (1) las alturas de los secuentes que preceden inmediatamente a 
dichas rayas horizontales tienen el mismo valor —!llamémoslo p— en A* y 
A*/2 (1i) sobre la raya en A* hay una inferencia con conectivo más que sobre 


28 En efecto, dicha altura es el grado más alto de un corte bajo esas rayas (como se recor- 


dará, no hay ninguna inferencia inductiva bajo ellas). Ahora bien, salvo por el nuevo corte 
con grado O entre [d,] y [e,], todos los cortes bajo [c,] reproducen cortes bajo [b,]. 
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cada una de las rayas en A"; (iii) si el ordinal de la premisa de esa inferen- 
cia con conectivo es 1, el de su raya horizontal es u+1 y ese 1 adicional se 
trasmite a través de las inferencias —todas estructurales— que llevan de las 
conclusiones anotadas en [a,] a las anotadas en [b,]; (iv) dicha inferencia 
con conectivo ha sido reemplazada en A' con inferencias estructurales cuyas 
rayas horizontales tienen el mismo ordinal que las respectivas premisas. Como 
ahora veremos, la desigualdad a. > KB > y implica que el secuente IP, > O, 
en la línea [g,] tiene un ordinal menor que el secuente I'; > O, en la línea 
[c,]. Este último es el primer secuente bajo el corte propio de la alianza de 
la fórmula VIY cuya altura —llamémosla u— es menor que la altura r de 
las premisas de ese corte. Como A* y AY son iguales bajo dicho secuente Ty 
> 0, es claro que la altura de éste en [g,] también es u. Asimismo, u es la 
altura del secuente I'z, Py > O, O, en la línea [f], puesto que entre [f] y 
[g,] no hay ningún corte o inferencia inductiva. Entre las líneas [e,] y [f£)] 
ocurre el nuevo corte. Sea t la altura de sus premisas. Es claro que u < t. 
Comprobemos que 1 < r. En efecto, o bien £ = u < r, o bien tf es igual al 
grado de la formula F(n1/r) cortada en el nuevo corte; ahora bien, r es ma- 
yor o igual que el grado de Vry, el cual, por cierto, es mayor que el grado 
de (1/1). Supongamos por el momento que las diferencias entre las alturas 
r, t y u son mínimas, esto es, que r =1 + 1 y £=u. Como el ordinal de la 
raya horizontal sobre la línea [c,] es a, el ordinal de Py >— O, en A* es 0%. 
Como los ordinales de las rayas horizontales sobre [d,] son PB y y (B > y), 
los ordinales de los secuentes en [d,] son wP y o”. Estos ordinales se trasmi- 
ten inalterados a través de las permutaciones entre [d,] y [e,]. Por lo tanto, 
una de las premisas del nuevo corte tiene el ordinal w* y la otra el ordinal 
(w*, de modo que el ordinal de la conclusión del nuevo corte es o? 4 0”, 
igual al ordinal de PT, > Oy en A', Ahora bien, a > PB > y implica que wm 
>0P +07=0? + 07? Si las diferencias entre las alturas r, £ y u exceden 


22 Sea S,, el “sistema” de índice más bajo a que pertenecen a, B y y. Utilizando la de- 


finición de la relación < en S,,,, es claro que 0% > $ + 07, puesto que el primer (y 
único) “exponente” del ordinal de la izquierda es mayor que el primer “exponente” del 
ordinal de la derecha. La desigualdad también puede probarse apelando al isomorfismo 
entre los ordinales de Gentzen y un segmento de los ordinales cantorianos, puesto que, 
si a, B, y y v son ordinales cantorianos tales que a. > > y y v> 3, v* > v.vB > 2vB 
> vP + v?. Pero esta prueba utiliza las propiedades de la multiplicación y la exponien- 
ciación de ordinales, que sólo pueden definirse por inducción transfinita (cf. Apéndice 
VID. 
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el mínimo, esto es, sir >1t+ 10 £>u, en vez de la desigualdad 0% > wP + 
o” se usa la desigualdad 


Qu OB... OY 
0-0: > 0-0: + (0 


Como A* y A! son idénticas bajo el secuente "y > O,, la desigualdad en- 
tre los ordinales de este secuente se trasmite al secuente final. Por lo tanto 


O(A%) < O(A*). 


Hemos demostrado, pues, que si Á es una derivación fatal, hay deriva- 
ciones fatales, A%, A* y A' tales que O(A?) < O(A*) < 0(A0) < O(A). Este 
resultado lleva derechamente a la conclusión de que no hay derivaciones 
fatales. Razonamos inductivamente, como sigue. 


00) Si A es una derivación tal que O(A) = 1, A no incluye cortes, inferen- 
cias inductivas ni inferencias con conectivo.* Consta, pues, de un 
solo hilo y su secuente final reproduce las prefórmulas y posfórmulas 
del secuente inicial (posiblemente acompañadas de otras, añadidas 
por debilitamiento). Por lo tanto, A no es una derivación fatal. 

(009) Sea a un ordinal de Gentzen mayor que 1. La hipótesis inductiva 
dice que si P' es una derivación tal que O(P') < a, F no es una de- 
rivación fatal. Sea A es una derivación tal que O(A) = a. Entonces 
A no puede ser fatal. En efecto, si lo fuera, existiría una derivación 
fatal A' tal que O(A*) < O(A) = a, contradiciendo la hipótesis 
inductiva. 

(UD Como toda derivación tiene un ordinal de Gentzen igual o mayor 
que 1, (1) y (ID) implican que ninguna derivación es fatal. 


En virtud del isomorfismo entre los ordinales de Gentzen y los ordinales 
de Cantor, a. recorre toda la serie de los ordinales entre 1 y g, Así, el argu- 
mento enterior es una inducción transfinita hasta el ordinal cantoriano gy. En 


30 Como se recordará, en estas tres clases de inferencia, el ordinal de la conclusión es 


mayor que el de las premisas y, por lo tanto, es mayor que 1. En cambio, las inferencias 
por debilitamiento, contracción y permutación trasmiten a la conclusión el ordinal de 
la premisa. 
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este respecto, Gentzen subraya que si prescindimos de las inferencias induc- 
tivas (de la clase IM; p. 428), la consistencia del cálculo puede establecerse 
por su método sin recurrir a una inducción transfinita. Para ello, hay que 
hacer los siguientes cambios en la asignación de ordinales a secuentes y de- 
rivaciones: (1) escribir el número 3 donde antes escribíamos w;*! (ii) reem- 
plazar “suma natural” por “suma” (la operación aritmética ordinaria); (111) 
entender las relaciones < y =, así como las operaciones de multiplicación y 
exponenciación, en su sentido aritmético ordinario (aplicado a números na- 
turales). Si no hay inferencias IM en el cálculo, el argumento inductivo para 
probar su consistencia puede utilizar el orden así definido. Entonces, obvia- 
mente, el ordinal a mencionado en la hipótesis inductiva (ID) es un número 
natural y la conclusión (II) se obtiene por inducción ordinaria. Vemos así 
que la inducción transfinita hasta el ordinal cantoriano e, se requiere sólo 
para probar la consistencia del cálculo con inferencias IM. Ello no puede 
sorprendernos. Al fin y al cabo, la escuela de Hilbert había establecido antes 
de 1930, con métodos incuestionablemente finitistas, la consistencia de la 
aritmética sin el Axioma PS5 de Peano (que valida la inferencia inductiva 
ordinaria). Por otra parte, en vista de los resultados de Gódel (1931), no es 
posible probar la consistencia de un sistema de aritmética formalizada con 
argumentos formalizables dentro de ese sistema, y la inducción matemática 
ordinaria es obviamente formalizable en el cálculo de Gentzen si se admiten 
las inferencias conforme al esquema IM. En suma, la prueba de Gentzen 
excede los recursos corrientes de la metamatemática hilbertiana para lograr 
un propósito que ya se sabía que era inalcanzable con ellos. A este respecto, 
vale la pena anotar que Hilbert y Bernays (1939, $85 y 3c) justificaron con 
los recursos de la aritmética finitista la inducción transfinita hasta cualquier 
ordinal menor que £/,2 y que Gentzen (1943) estableció que la inducción 
transfinita hasta e, no puede justificarse con dichos recursos. Esto quiere decir 
que sus dos demostraciones de la consistencia de la aritmética (Gentzen 1935, 
1938) exceden los recursos de la aritmética finitista sólo el mínimo indis- 


dde Se usa el 3 por la razón indicada en la nota 29: 3 es el más pequeño número natural 


n tal que sia,b,ce Nya>b>c,n* > nn? > 2n? > n? + n*. Como vimos, esta 
desigualdad se invoca en una etapa del razonamiento. 


32 Gentzen aparentemente alude a este resultado cuando observa que la inducción trans- 


finita hasta un ordinal menor que e, se puede demostrar en su cálculo (1938, p. 43). 


38 El resultado de Gentzen 1943 puede verse como una confirmación independiente de 
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pensable para no contradecir los resultados de Gúdel (1931).* 

Alfred Tarski observó en una ocasión que, aunque la prueba de consisten- 
cia de Gentzen es sin duda muy interesante y puede resultar muy estimulan- 
te y fecunda, no le parecía que “la consistencia de la aritmética fuese ahora 
mucho más evidente para mí que antes de conocer esa prueba” (1954, p. 19; 
cit. en Szabo 1969, p. 10). Pero Gentzen no pretendía demostrar la consis- 
tencia de la aritmética. Como él mismo explica con insuperable claridad: 


No se trata en absoluto de la consistencia (Widerspruchsfreiheit) del do- 
minio de los números como tal, esto es, de las relaciones básicas entre los 
números fijadas por los “axiomas” (por ejemplo, por los “Axiomas de 
Peano” de la aritmética). Demostrar la consistencia de estos axiomas sin 
dar ya por supuesto algo equivalente es impensable. Se trata más bien de 
la consistencia de la deducción lógica (des logischen Schliefens) aplicada 
a los números naturales (a partir de sus axiomas), como se la practica en 
las pruebas de la aritmética. 

(Gentzen 1935, p. 498) 


Concretamente, se trata de establecer que no es posible derivar contradicciones 
en la aritmética formalizada en el cálculo de Gentzen, o en otro cálculo equi- 
valente o menos poderoso. Para la escuela de Hilbert este resultado era 
imprescindible, pues sólo sobre esa base se podía establecer la consistencia 
de la teoría de conjuntos formalizada, recuperando así todas las comodidades 
que ofrece al matemático “el paraíso de Cantor” sin suscribir la metafísica 
cantoriana del infinito. En lo relativo al infinito, la postura de Gentzen era 
bien decidida: 


No se debe considerar un agregado infinito como cerrado y existente en 
sí (infinitud actual), sino sólo como algo en devenir, que puede siempre 
seguir edificándose constructivamente desde lo finito (infinitud potencial). 

(Gentzen 1935, p. 524; cursiva en el original)** 


Gódel 1931, que ilustra “de un modo directo la incompletud del formalismo aritméti- 
co” (Szabo 1969, p. 17). Después de Gentzen, Ackermamn (1940) y Schiitte (1951) han 
publicado nuevas pruebas de la consistencia de la aritmética elemental que, por cierto, 


también se valen de la inducción transfinita hasta £¿. 


di Hablando de la tesis intuicionista de que las proposiciones sobre el infinito actual ca- 


recen de sentido y deben, por ende, rechazarse aunque sean consistentes, Gentzen de- 
clara: “Creo, por ejemplo, que en la teoría general de conjuntos una investigación 
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Por eso mismo, como luego veremos, pone gran empeño en convencernos 
de que su prueba de consistencia sólo emplea razonamientos finitistas, con- 
forme a las exigencias de Hilbert. Pero esa prueba debe juzgarse valiosa 
también aparte de todo melindre metafísico, especialmente ahora que tantos 
resultados matemáticos son el producto de computaciones electrónicas que 
sólo pueden verificarse cotejándolas con otras computaciones. Tal cotejo sólo 
certifica —o, mejor dicho, hace sumamente probable— que las computacio- 
nes son correctas, que las máquinas que las ejecutaron no han cometido 
errores en la ejecución de las instrucciones del programa. Pero el resultado 
de una computación correcta puede ser incorrecto si el programa mismo es 
la versión electrónica de un cálculo inconsistente. De ahí que sea importante 
probar la consistencia del cálculo incorporado en el programa, con métodos 
evidentes para nosotros, aunque no sean formalizables en ese cálculo. 
Aunque las alegaciones de Gentzen no acaben de persuadirnos de que su 
inducción transfinita merece llamarse “finita? o siquiera “finitista” (finit), ex- 
plican con gran claridad por qué tiene que resultarnos —y de hecho nos 
resulta— evidente. Gentzen admite que, a diferencia de todos los otros pa- 
sos de su prueba, la inducción transfinita no es propiamente elemental. Por 
eso “encaramos aquí una tarea de índole completamente distinta: lo esencial 
no es demostrar la inducción transfinita —lo cual no es difícil y se puede 


metamatemática cuidadosa confirmará eventualmente que todas las cardinalidades ma- 
yores que las numerables son en un sentido muy definido sólo una apariencia vacua y 


que sería prudente prescindir de estos conceptos” (1936/37, en Gentzen, CP, p. 229). 


as Gentzen escribe “vielmehr sie auf finiter Grundlage zu beweisen”. Para el lector ale- 


mán desapercibido finit no puede significar otra cosa que “finito, finita”. Pero entonces 
la palabra tiene un significado inequívoco que no puede cubrir la inducción transfinita 
de Gentzen, no sólo a causa de su nombre de mala fama (“ihres anriichigen Namens 
wegen” —Gentzen 1938, p. 44), sino porque ella recorre toda la serie de los números 
naturales una multitud infinita —aunque numerable— de veces. Pero Gentzen dice 
expresamente que el carácter “finit” de su prueba no puede propiamente “demostrarse” 
debido a que el concepto finit no está inequívocamente definido y malamente se puede 
definir (“weil der Begriff “finit” nicht eindeutig formal abgegrenzt ist und auch kaum 
abgegrenzt werden kann”—1935, p. 557). Por eso, prefiero traducir finit con “finitista” 
(los autores de habla inglesa dicen “finitary”) y dejar el significado de esta palabra en 
la penumbra que el programa de Hilbert aparentemente necesita para sobrevivir. 
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hacer de varias maneras— sino más bien demostrarla sobre una base 
finitista,*5 esto es, poner en claro que es un modo de inferencia acorde con 
el principio de la concepción constructiva del infinito” (1938, p. 44). Para 
que no quepa duda de esto, Gentzen subraya reiteradamente que sus ordinales 
no son lo mismo que los ordinales de Cantor, sino unos objetos “formales” 
—esto es, símbolos, figuras que pueden escribirse en un papel o en una pi- 
zarra— definidos por él. Gentzen estima que su definición es estrictamente 
constructiva: cada ordinal es una figura formada según reglas precisas con 
los dos signos primarios O y 0. Dado un ordinal cualquiera a., sabemos cons- 
truir su sucesor inmediato a. + 0%. Pero ¿es justo llamar “constructivo” el 
paso de cada sistema de ordinales S, al sistema siguiente S,,,? Dicho paso 
presupone que los ordinales del sistema S, ya estén definidos, y el número 
de éstos es obviamente infinito (cf. p. 441, nota 23). Parecería que, contra- 
riando el citado precepto de Gentzen, el sistema infinito S, se tiene que con- 
siderar aquí como cerrado, y no sólo como algo en devenir. Si este modo de 
introducir sistema S,,, (para cada n e N) se ajusta a la “concepción construc- 
tiva del infinito”, ¿en qué se aparta de ella la definición cantoriana de los 
ordinales? Para responder a esta pregunta, conviene recordar los tres “prin- 
cipios generadores” aducidos por Cantor (GA, pp. 195ss; vide supra, Capí- 
tulo 2.5). El más aventurado de ellos, el principio “de inhibición o limita- 
ción”, produce los ordinales cantorianos de las clases tercera y superior, y 
por lo tanto no desempeña ningún papel en la definición de los ordinales de 
Gentzen. Los otros dos presiden la generación (1) del ordinal siguiente a cada 
ordinal dado y (11) del ordinal límite de cada serie numerable infinita de 
ordinales sucesivos. En virtud del isomorfismo entre los ordinales de Cantor 
(< £0) y los de Gentzen, es claro que éstos satisfacen tanto el principio (1) 
como el principio (11). Pero los ordinales de Gentzen no se generan según el 
principio (11) —que un finitista debiera cuestionar—, sino según una regla 
que autoriza a escribir expresiones de la forma 0% + 0% +...+ 0%: con 
cualquier número de exponentes a, seleccionados arbitrariamente en un sis- 
tema de expresiones dado. Una regla como ésta, puramente sintáctica, es sin 
duda constructiva. Para el finitista no hay pues ninguna dificultad en el trán- 
sito de un sistema gentzeniano dado £, al sistema siguiente S,,,¡. Pero a la 
luz de esta explicación resalta aún más la dificultad señalada arriba: si ex- 
ceptuamos el sistema S, cuyo único elemento es el objeto O, ¿qué sistemas 
de Gentzen están dados? El Axioma del Infinito de los conjuntistas nos da, 
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por cierto, el sistema S,, y una vez que disponemos de él, no cuesta mucho 
asegurarse los siguientes. Pero el Axioma del Infinito postula justamente un 
agregado infinito actual, “cerrado y existente en sí”. ¿Puede uno aceptarlo y 
seguir llamándose finitista? Y si uno acepta ese agregado y, como es habi- 
tual, lo llama w (en vez de concebir a este signo “de un modo enteramente 
formal”, como pide Gentzen), ¿por qué inhibirse de aceptar Pw, P%,..., 
Po, ... ? ¿Dónde se tira la raya? 

Después de Gentzen, la teoría de la prueba se consolida como una disci- 
plina matemática que produce resultados interesantes mediante el análisis 
combinatorio de la deducibilidad en los cálculos lógicos y las teorías mate- 
máticas formalizadas en ellos (cf. los manuales de Schiitte 1960 y Takeuti 
1975); pero ya nadie la presenta a la manera de Hilbert como una fuente de 
certeza filosóficamente incontrovertible, garantía de las ciencias y pilar de la 
civilización (cf. p. 120, nota 10). En un artículo de enciclopedia publicado 
en 1980,* Schiitte describe la teoría de la prueba (Beweistheorie) como una 
de las divisiones de la “metamatemática” o investigación matemáticamente 
exacta de teorías matemáticas formalizadas (se recordará que Hilbert usaba 
Beweistheorie y Metamathematik como sinónimos). Schiitte asigna a otra 
división las cuestiones de computabilidad y decidibilidad que hemos visto 
surgir de la problemática hilbertiana pero que ahora se estudian independien- 
temente, en la teoría de las funciones recursivas y de los conjuntos recursi- 
vamente enumerables (cf. los manuales de Rogers 1967 y Soare 1987), orien- 
tada sobre todo hacia las “ciencias de la computación”. Por último, Schútte 
incluye en la metamatemática una tercera división: “la teoría de modelos, 
que se ocupa con las interpretaciones y las cuestiones de realizabilidad de 
los sistemas de axiomas de la lógica y la matemática”. Como veremos en la 
Parte 3, el enfoque y los métodos de la teoría de modelos han producido 
desde los años 30 algunos hallazgos sumamente significativos para la filoso- 
fía matemática conjuntista. Veremos allí que esta forma de “metamatemática”, 
tal como la cultivan Tarski y Gódel, descarta el prejuicio finitista de Hibert 
y aprovecha sin remilgos las facilidades de la teoría de conjuntos. En esta 


Recomiendo leer las iluminadoras observaciones de Gódel sobre la inducción hasta £, 
(1958, pp. 281 s.; traducción inglesa en Gódel, CW, IL, 243). 
37 Ritter y Griinder, HWP, vol. 5, col. 1176, s.v. “Metamathematik, IT”. 


2.12 La prueba de Gentzen 455 


forma, la “metamatemática” explora y perfecciona el paraíso de Cantor des- 
de dentro, en vez de pretender cimentarlo y fortificarlo con recursos pedestres 
desde fuera. La empresa alcanza su punto más alto cuando Gódel (1938, 1939; 
cf. 1940) demuestra que la teoría de conjuntos de Zermelo-Fraenkel (ZF) es 
compatible con el Axioma de Selección (AS) y la Hipótesis generalizada del 
continuo (HGC). Quedó así establecido que las conjeturas más audaces de 
Cantor —el teorema del buen orden, la hipótesis del continuo— son al me- 
nos tan viables como el sistema ZF, cuya consistencia se acepta, en general, 
sin discusión.* El conjuntismo triunfante tendrá, sin embargo, un vuelco 
sorprendente cuando Paul J. Cohen (1963/64, cf. 1966) demuestre, mediante 
un novedoso método de construcción de modelos, que ZF es compatible tam- 
bién con la negación de AS y la negación de HGC. Aunque aceptemos que 
la citada demostración de Gúdel prácticamente inmuniza al cantorismo con- 
tra el riesgo de contradicción, ¿de qué vale esta seguridad, si el resultado 
obtenido por Cohen muestra que el de Cantor no es el único paraíso conjun- 
tista disponible y no tenemos cómo saber en cuál estamos parados? 


Como ha dicho Boolos, “es apenas concebible que ZF sea inconsistente” (1987, en 
Demopoulos, 1995, p. 219). 


CUADRO 2 


[h'] : [g] ] S [h] ] [g'] 
TP, > 0, Fx) SGU), P, > O, TP, > 01, 3(a/x) FU), P, > O, 
P, > 3(U1),0,VIF M1), TP, > O, T,> 0,VYIS — VYB,T) FQUUL) > O, 
P > F(U1E), O, VIS VIS, A > A T > 0, VES VEB, A, YQUL) > A 
T,A> FO), O, A T, A, Y(1x) > 0, A 
Pz > 03, $) SQL), Pz > 03 


P3, 3 > 03, 03 


T;z > 03 


[a,] 


[b,] 


[c,] 


[d,] 


[e 2) 
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APÉNDICES 


LAS DEFINICIONES CANTORIANAS DE 
“CONJUNTO BIEN ORDENADO” 


Demostraré aquí que las dos definiciones de conjunto bien ordenado que dio 
Cantor son equivalentes (v. Capítulo 1.5). Recordemos que un conjunto M 
es un conjunto linealmente ordenado si y sólo si hay una relación binaria < 
definida sobre M, tal que si a, b y c son distintos elementos de M (1) o bien 
a<bo bien b < a, pero nunca las dos cosas a la vez; (11) sia<byb<c, 
a <-c; y (111) nunca ocurre que a < a. 

Formularé las condiciones características de un conjunto bien ordenado 
según ambas definiciones en un cálculo predicativo de primer orden con 
identidad =, predicados binarios e, C, <, y una constante individual M que 
designa el conjunto de referencia.! Para simplificar la escritura empleo 
cuantificadores restringidos. Esto quiere decir que la expresión (Vx=M)D(x)” 
debe leerse “todo objeto x que sea parte de M satisface la condición QP” y la 
expresión (Bye x)D(y) debe leerse “hay un elemento y del conjunto x, tal 
que D(y)”. (En suma, (Vx=<MOD(x) y Eye xo(y) abrevian, respectivamen- 
te, a Vx(x € M > (0) y yO € x A D(y))). 


BUEN ORDEN (CANTOR 1899). Un conjunto linealmente ordenado M está bien 
ordenado por la relación < si y sólo si toda parte no vacía de M tiene un 
primer elemento (respecto al orden inducido por <), esto es, si y sólo si M 
cumple la siguiente condición: 


BO (VxMIU + YD > lyex)WzE0D Ay > y“y<zw) 


En el Apéndice IX se explica el concepto de cálculo predicativo de primer orden para 
beneficio de los lectores con cierta educación matemática que no hayan estudiado ló- 
gica. 
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BUEN ORDEN (CANTOR 1883). Un conjunto linealmente ordenado M está bien 
ordenado por la relación < si y sólo si M cumple las tres condiciones si- 
guientes: 


BO1 Exe MV ye MA + y > x < y) 

(M tiene un primer elemento con respecto al orden inducido por <). 
BO2 (Vxe MV ye MO 4x > y <x) v 
Eye Mx <y A (VzEMAAS<ZAZAY>Yy<ZD)) 


(Todo elemento de M que no sea el último elemento de M tiene un suce- 
sor inmediato en el orden inducido por <). 


BO3 VucMiu + Y > Aye MVz3EMAG E u>2z2<yA 
(Vwe MZ € U>2<W) > (y = w v y < w))) 


(Si una parte no vacía u de M tiene sucesores en el orden inducido por < 
—esto es, si hay elementos de M que suceden a todos los elementos de 
u—, u tiene un sucesor próximo — esto es, hay un elemento de M prece- 
dido por todos los elementos de u pero a su vez precede a cualquier otro 
elemento de M precedido por todos los elementos de u). 


Paso a demostrar que si M % W, la condición BO equivale a la conjunción 
de BO1, BO2 y BO3. 

BO implica BO1, puesto que M es una parte no vacía de M y por ende 
tiene un primer elemento. Además, BO implica BO3. En efecto, sea u una 
parte propia no vacía de M y sea u' su complemento en M. Sea S(u) = 
[w:z € u > Zz < w). Entonces, si S(u) + /W, la intersección u' A S(u) + Y y 
tiene un primer elemento y, que es el sucesor próximo de u. Si x es un ele- 
mento de M que no es el último elemento de M, el mismo argumento prueba 
que el conjunto (x) tiene un sucesor próximo, que es, por cierto, el sucesor 
inmediato de x. Por lo tanto, BO implica BO2. 

Por otra parte, si M no cumple la condición BO hay por lo menos una 
parte no vacía que no tiene un primer elemento, esto es, un conjunto u < M 
tal que u 4 Y y para todo x e u hay un y e u tal que y < x. Sea [u] el 
conjunto de los predecesores de u, es decir, sea [u] = (ze M: (Vxe MXx e 
u > 2 < x)). Si [ul] = Y, M no tiene un primer elemento y, por ende, no 
cumple la condición BO1. Si [u] 4 4, [u] es una parte no vacía de M que 
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tiene sucesores pero no tiene un sucesor próximo, de modo que M no cum- 
ple la condición BO3. 


TI 


MÁS SOBRE EL BUEN ORDEN 


Las definiciones y teoremas contenidos en este apéndice completan y preci- 
san las ideas sobre conjuntos bien ordenados expuestas en el Capitulo 1.5. 


DEFINICIÓN 1. Si los conjuntos K, y K, están ordenados, respectivamente, por 
las relaciones <, y <,, diremos que la aplicación f: K, — K, es un morfismo 
de órdenes si para todo x, y e K,, x<, y si y sólo si f(x) <, f(y). Si f 
además es biyectiva decimos que es un isomorfismo de órdenes. Un isomor- 
fismo cuyo dominio y codominio coinciden se llama un automorfismo. (Cuan- 
do ello no dé lugar a confusión, omitiré la frase “de órdenes” y diré sencilla- 
mente “morfismo”, “isomorfismo”, “automorfismo”.) 


DerFiNICcIÓN 2. Si (K,<) es un conjunto bien ordenado y x e K, la sección 
determinada por x en K es el conjunto bien ordenado (£z: z < x),<) y el re- 
manente determinado por x en K es el conjunto bien ordenado ((z: x < z$,<). 


ProposIcióN 1. Si (K,<) es un conjunto bien ordenado y f: K —> K es un 
morfismo, x < f(x) para todo x e K. 

Indudablemente, x < f(x) si x es el primer elemento de K. Supongamos 
que x no es el primer elemento de K y que y < f(y) para todo y < x . Como 
f es un morfismo, f(y) < fGx). Por lo tanto, f(x) está precedido por todos los 
predecesores de x, de modo que x < f(x). 


PROPOSICIÓN 2. Si (K,<) es un conjunto bien ordenado el único automorfismo 
f:K—= Kes la identidad, f(x) = x. 
Sea f:K —= K un automorfismo. Por la Proposición 1, x < f(x) para todo 
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xe K. La aplicación inversa f”! también es un automorfismo, de suerte que 
z< fUz) para todo z e K. Reemplazando z por f(x) en esta desigualdad, 
tenemos que f(x) < FUFG6)) = x< f(x) para todo x e K. Por lo tanto, x = 
FG) para todo xe K. 


PROPOSICIÓN 3. Si los conjuntos bien ordenados (K,<,) y (K,,<,) son isomór- 
ficos, hay un solo isomorfismo f: K, —> K.,. 

Sean f: K, => K, y h: K, => K,, isomorfismos. Entonces f7!: K, => K; es 
un isomorfismo y f-'h es un automorfismo de (K,,<,). Por lo tanto f”!h es 
la identidad sobre K,, y f = h. 


ProposIcióN 4. Si (K,<) es un conjunto bien ordenado y a es cualquier ele- 
mento de K, (K,<) no es isomórfico a ([a],<), el segmento de K determinado 
por a. 

Para demostrar esta proposición, suponemos que es falsa y que hay un 
isomorfismo f con dominio K y alcance [a]. Por la Proposición 1, a< fía), 
ya que f: K—> K es un morfismo. Pero esto contradice la suposición de que 
el alcance de f es el conjunto de los predecesores de a. 


ProposIcióN 5. Si los conjuntos bien ordenados (K,,<;) y (K,,<,) no son 1so- 
mórficos, entonces (K,<,) es isomórfico a una segmento de (K,,<,) O (K),<>) 
es isomórfico a un segmento de (K,<,). 

Definiré una aplicación f,:[x] U (x) => K, para cada x e K;, que cumpla 
una de estas dos condiciones: o bien x es el primer elemento de K,, o bien 
f_ está definida para todo z <, x y el alcance de f_ no es igual a K,. Doy la 
definición de f, mediante dos condiciones que corresponden, respectivamente, 
a cada una de las dos partes disjuntas mencionadas en la descripción del 
dominio de f,, a saber, (x) y [x] = tze K,¡:z <, x5: 


(1) Sea u el primer elemento de K, tal que, para todo z <, x, u * fz). 
fx) = u. 
(2) Para todo z <;x, $. (2) = $2). 


Como es obvio, esta definición implica que si x es el primer elemento de 
(K¡<1), f,(0) es el primer elemento de (K,,<,). Si f, está definida para cada 
x€ K¡,x > f,(x) es un isomorfismo de (K;,<,) en un segmento de (K,,<,) 
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(su alcance no puede ser igual a K, ya que, por hipótesis, (K,,<,) y (K,,<)) 
no son isomórficos). En cambio, sí f, no está definida para algún xe K;, y 
í es el primer elemento de Ki, tal que f, no está definida, la aplicación f: [4] 
> K,, x > f,(%) es un isomorfismo de un segmento de (K,,<,) en (K,,<)). 


ProPOsIcIÓN 6: Si (K,<) es un conjunto bien ordenado y H C K, (H,<) es un 
conjunto bien ordenado isomórfico a (K,<) o a un segmento de (K,<). 

Que (H,<) está bien ordenado se prueba así: si H = Y, (H,<) está por 
cierto bien ordenado; si H * Y y G es una parte no vacía de H, sea G' la 
unión de los remanentes determinados en K por cada elemento de G. Enton- 
ces, G' es el remanente determinado en K por algún u e G, y u precede a 
todos los otros elementos de G. Ahora bien, si (K,<) fuese isomórfico a un 
segmento [u] de (H,<) habría un isomorfismo f: K => [u]. En tal caso, como 
ue K, f(u) e [u] y, por consiguiente, f(u) < u. Pero según la Proposición 
I esto no es posible si f preserva el orden <. Por lo tanto, en virtud de la 
Proposición 5, (H,<) es isomórfico a (K,<) o a un segmento de (K,<). 


1081 


LA CARDINALIDAD DE LA SEGUNDA CLASE DE ORDINALES 


Aquí bosquejaré una demostración de que (1) el conjunto de los ordinales 
infinitos de la segunda clase es más numeroso que el conjunto [w] de los 
ordinales finitos y que (11) no existe una numerosidad intermedia entre la de 
este conjunto y la de aquél. Con la nomenclatura utilizada en el Capitulo 
1.5, estas dos tesis pueden expresarse así: (1) Ny <l[o, IMo]l y (11) no hay 
un conjunto de ordinales K, tal que SN, <IKl<l[0, IMlo]!. Ello implica que 
I[o, IMlo]!l = S,. Los argumentos que aduciré para establecer este resultado 
provienen de Cantor 1897 (GA, pp. 331-33). 

(1) Sea n > a, una aplicación inyectiva de [0] en la Clase (ID). Si la lista 
Ay) OL¡, Az, - . . Contiene todos los ordinales de la Clase (11), éstos tienen que 
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figurar en ella en un orden distinto del fijado por la relación <.? Sea k, el 
índice más bajo asignado en esta lista a un sucesor de 0. (esto es: Ay < 0, 
y 0, <a, sólo si ky< k). Sea k, ,, el índice más bajo asignado en la lista a 
un sucesor de ax, (n > 0). Entonces, la lista AL, A,,, 0, - .. es una secuen- 
cia infinita, ordenada por la relación <, de números de la Clase (II) ninguno 
de los cuales sucede a todos los otros. Por lo tanto, existe un ordinal a, de 
la Clase (ID), que es el sucesor próximo de los ordinales contenidos en la 
lista 0, Oy go En otras palabras, existe un a. tal que 0L,, < 0 para 
todo n > 0 y a es menor que cualquier otro ordinal —si lo hubiere— que 
sea mayor que todos los ordinales en la lista QLy, 0, , Ay, ... Si UL figurara 
en la lista Oy, 0.,, AL), . .. tendríamos que QU = 01, < Q,, para algún k y n>0. 
Por lo tanto, o. no pertenece al alcance de la aplicación n —> aL, En conse- 
cuencia, dicha aplicación no es biyectiva. Este razonamiento vale para cual- 
quier inyección de [w] en la Clase (II). Por lo tanto, la Clase (ID) es más 
numerosa que [co]. 

(11) Sea K un conjunto infinito de ordinales de la Clase (ID). Sea K' =Ku 
[0]. Entonces, por la Proposición 6 del Apéndice III, (K”,<) es un conjunto 
bien ordenado isomórfico a ([o, ],<) o a un segmento [o] de ([o, ],<), donde 
a es un ordinal de la Clase (II). En el primer caso, |K'| = l[o, ]l y 1Kl = 
I[o, IX[o]!. En el segundo caso, |IKI <1K"| = l[a]! = N ¿. Por lo tanto, no hay 
un conjunto de ordinales de la Clase (II) que sea menos numeroso que la 
Clase (ID) pero más numeroso que la Clase (D. 


En el orden fijado por la relación < hay muchos ordinales de la Clase II que no tienen 
sucesor inmediato; pero en el orden de la lista 0.,, 0L,,... , cada ordinal a, tiene un 


sucesor inmediato 0, 
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EL ARGUMENTO DE BURALI-FORTI 


Burali-Forti (1897) se propone “demostrar que hay números transfinitos (o 
tipos de orden) a y b, tales que a no es igual a b ni menor que bh ni mayor 
que b”. El trabajo adolece de cierta desidia terminológica, patente ya en esta 
primera oración, que equipara las expresiones “número transfinito” y “tipo 
de orden” (con explícita referencia a Cantor 1895). En el vocabulario del 
grupo de Peano, al que pertenecía Burali-Forti, la palabra “clase” (Fr. o It. 
“classe”) se usaba como sinónimo de “conjunto” (“ensemble quelconque 
d'objets”—Peano 1894, p. 4). Burali-Forti emplea “orden” como sinónimo 
de lo que aquí he llamado “orden lineal” y define un tipo de orden como una 
clase de clases ordenadas, equivalentes por isomorfismo. Por una inadver- 
tencia (corregida en Burali-Forti 1897a), Burali-Forti entiende que una clase 
bien ordenada en el sentido de Cantor es una clase ordenada que cumple las 
condiciones BO1 y BO2 del Apéndice I. Por su parte, define una clase per- 
fectamente ordenada como una clase ordenada (M,<) que reúne las condi- 
ciones BO1 y BO2 y llena además el siguiente requisito: 


BF Six e M y x tiene un predecesor inmediato,? hay un u, e M tal 
que uy < x y una clase finita (u¿, U¡,... ,U,) < M, tales que u, es 
el predecesor inmediato de 4,,¡ (0 < k < n) y u, es el predecesor 
inmediato de x. 


BF se deduce de la condición BO que define un conjunto bien ordenado en 
el genuino sentido cantoriano, pero no equivale a ella. Por lo tanto, si M 
está bien ordenado en el sentido de Cantor, está perfectamente ordenado en 
el sentido de Burali-Forti, pero no a la inversa. Burali-Forti define un *nú- 
mero ordinal” como el tipo de orden de un conjunto perfectamente ordena- 
do. Evidentemente, habrá ordinales de Burali-Forti que no sean ordinales 


' Si < determina un orden lineal en M, digo que y e M es el predecesor inmediato de x 


e Msi y < x y, cualquiera que sea ze M,z<x => 25 y. La expresión “sucesor 
inmediato” se define reemplazando “<” por *>” y “<” por *>” en la definición anterior. 
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cantorianos. En el resto de este apéndice usaré minúsculas griegas para de- 
signar ordinales de Burali-Forti. Designaré con O a la clase (8: € es un ordinal 
de Burali-Fortij. Sean (A,R) y (B,5) dos clases perfectamente ordenadas, con 
tipo de orden a. y fP, respectivamente. Burali-Forti dice que a. < B (a es 
menor que PB”) si (A,R) es isomórfica a una parte de (B,S) y (B,S) no es 
isomórfica a una parte de (A,R). La relación < es irreflexiva (si a < PB, es 
falso que a = $), antisimétrica (si a. < BP, es falso que B < a) y transitiva (si 
a <B y B < y, a < y), pero < no ordena a la clase O debido a que, según 
el teorema anunciado al principio, hay ordinales a. y fl tales que ni a. < f, ni 
a =P, np <a. 

La prueba del teorema depende de dos proposiciones, P, y P,, que de- 
mostraré luego: (P,) Si € es un ordinal, existe un ordinal £/ mayor que £ tal 
que, si £ es un ordinal mayor que €, E <€ < 8 (£' es el sucesor inmediato 
de E). (P,) Si (O,<) es una clase perfectamente ordenada, con tipo de orden 
Qe O, y £ es cualquier ordinal, € < Q. Burali-Forti argumenta así: Supon- 
gamos que < ordena a O. Entonces (O,<) es una clase perfectamente orde- 
nada,* y su tipo de orden Q e O. En virtud de P, existe un ordinal (Y >Q. 
En virtud de P,, (Y < Q. Esta contradicción implica que < no ordena a O y 
que, por lo tanto, hay ordinales a. y fB tales que ni a < f, ni a = ÉB, ni 
B<a. 

Para establecer la proposición P,, consíderese cualquier clase perfectamente 
ordenada (A,R) con tipo de orden a. y un objeto z £ A. En la clase AU£Z) 
definimos una relación de orden T' como sigue: xTy si xRyosixe Ae y= 
z. (AUXZ3,T) es una clase perfectamente ordenada con tipo de orden a! > a. 


(O,<) cumple las condiciones BO1 y BO2, puesto que hay un primer ordinal y cada 
ordinal tiene un sucesor inmediato (por P,). Para ver que (O,<) cumple además la con- 
dición BF recuérdese que si a es un ordinal, a es el tipo de orden de una clase perfec- 
tamente ordenada (M,P). Como (M,P) cumple la condición BF, si a. tiene un predece- 
sor inmediato en (O,<), hay un ue M tal que el predecesor inmediato de a es el tipo 
de orden de la clase perfectamente ordenada (MNXu),P). u tiene un predecesor inme- 
diato en (M,P) y en virtud de la condición BF, M contiene una subclase finita (uy, 
U¡,... 4, = Uy, tal que uy no tiene predecesor inmediato y, para cada entero k (0 < k 
< n), u, es el predecesor inmediato de 4j.,¡. (UNLUz Uy 1) « « - .U/ y P) es una clase per- 
fectamente ordenada. Sea fB, su tipo de orden. Vemos entonces que O contiene una 
subclase finita (Bo, P;,... , PB, = 0), tal que fB, no tiene predecesor inmediato y para 
cada entero k (0 < k< n), PB, es el predecesor inmediato de B,,¡. Por lo tanto, (O,<) 
cumple la condición BF. 
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En vista del modo como se ha construido a', es claro que no puede haber 
un ordinal € mayor que a. y menor que a.'. Esta demostración de P, no sería 
aplicable a un ordinal a. si a fuera el tipo de orden de la clase perfectamente 
ordenada de todo lo que hay (si hubiera tal clase), pues entonces no habría 
un objeto z que pudiera agregarse a dicha clase para construir otra con tipo 
de orden a' > a. Pero en la demostración del teorema se considera sólo el 
tipo de orden de (O,<), y hay por cierto muchos objetos que no son ordinales 
de Burali-Forti. Si q £ O, es posible extender de una manera obvia el orden 
<a la clase O U (q). Entonces (O U (£q),<) tiene un tipo de orden « tal que 
ke Oyk>0, 

La proposición P, se establece así: Sea a el tipo de orden de la clase 
perfectamente ordenada (A,R) y sea A, =(2:2€ An —=xRz), para cualquier 
x € A. Entonces, la clase W = (4,: x e A) es una clase de clases per- 
fectamente ordenadas, cada uno de cuyos elementos es una subclase de A. 
Digamos que A,SA, si y sólo si xRy. W está ordenada por la relación 5 y las 
clases ordenadas (W,S) y (A,R) son isomórficas. Por lo tanto, (W,S) es una 
clase perfectamente ordenada con tipo de orden a.. Sea [a] la clase de 
ordinales (a, :x e A y aL, es el tipo de orden de (A,.S)). [a] reune todos los 
ordinales menores que a.. Evidentemente, ([a.],<) es una clase ordenada 
isomórfica a (W,S). Por lo tanto, el tipo de orden de ([a.],<) es a. Como ([a],<) 
es isomórfica a una parte de (O,<), es claro que a. < (2. 

Como ya habrá advertido el lector, la contradicción generada por Burali- 
Forti para probar su teorema no tiene nada de paradójica. Como en cual- 
quier reductio ad absurdum, la contradicción sirve eficazmente para refutar 
la negación de la tesis que el autor se ha propuesto demostrar. El teorema 
puede probarse también sin mencionar el tipo de orden (2 de la clase de los 
ordinales de Burali-Forti. Basta tener presente que hay ordinales de Burali- 
Forti que no son ordinales de Cantor. Sea (A,R) un conjunto bien ordenado 
con tipo de orden a. y sea (B,S) un conjunto perfectamente ordenado pero no 
bien ordenado, con tipo de orden $. Supongamos que 1Bl < Al. En tal caso, 
(A,R) no puede ser isomórfico a una parte de (B,S», de modo que a + fP y a 
no es menor que $. Sea H C A tal que IA =1Bl y sea f:H > B biyectiva. f 
no puede ser un isomorfismo entre (H,R) y (B,S), por cuanto (H,R) es un 
conjunto bien ordenado (por la Proposición 6 del Apéndice IT).* 


5 Como (B,S), por hipótesis, no es un conjunto bien ordenado, hay un subconjunto no 


vacío K E B que no tiene un primer elemento (en el orden S). El conjunto f-'K de los 
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El argumento de Burali-Forti es aplicable también a los ordinales canto- 
rianos, esto es, los tipos de orden de los conjuntos bien ordenados. Pero en 
este caso, tenemos también una prueba —basada en la Proposición 35 del 
Apéndice II — de que la clase de los ordinales está bien ordenada por <. 
Esta prueba depende esencialmente de la referencia al ordinal cantoriano de 
la clase de todos los ordinales cantorianos y constituye una refutación de la 
hipótesis de que dicho ordinal existe. En su correspondencia con Dedekind, 
Cantor indica que su inexistencia se debe a que los ordinales no se dejan 
reunir todos en un conjunto (Cantor, GA, pp. 443ss.). 


v 


LA NUEVA DEMOSTRACION DEL TEOREMA DEL BUEN ORDEN 
(ZERMELO 1908) 


Sea M un conjunto no vacío y f un selector para PMNX(D). Llamo Ay al 
conjunto AXEF(A)?. (Zermelo lo llama A', pero en la nomenclatura ahora 
habitual esta expresión designa a MMA, el complemento de A en M). Una f- 
cadena de M es un conjunto K < PM tal que: 


Cl. Me K. 
C2. SiAe K, Ay € K. 
C3. SiHcK,(Me K. 


Esta definición implica que la intersección de varias f-cadenas de M tam- 
bién es una f-cadena en M. Con Zermelo, llamaré M a la intersección de 


elementos de H que f envía a K es una parte del conjunto bien ordenado (H,R) y por 
lo tanto tiene un primer elemento u (en el orden S). Pero f(u) no puede ser el primer 
elemento de f—!K y por lo tanto hay un ve K tal que vSf(w). fvw) e PUK y si f 
fuera un isomorfismo, tendríamos que f-'(v)Ru, contraviniendo el supuesto de que u es 
el primer elemento de f-!K. 
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todas las f-cadenas de M.* El lector debe comprobar que M < PM cumple 
las condiciones C1-C3. 

El primer paso de la demostración consiste en construir un conjunto A < 
M con propiedades interesantes para la tarea entre manos. A e A si y sólo si 
Ae M y, para todo X e M, Xx A implica que, o bien X 4,0 bien Ac X. 
Mostraremos que A es una f-cadena en M. Como M es la intersección de 
todas las f-cadenas de M, esto implica que M < A < M, es decir, que 
A=M. 

A cumple la condición Cl, puesto que, evidentemente, Me A. 

SiAe A, llamo U, al conjunto (Xe M:X* An Xc A) y Y, al conjunto 
[Xe M:X An A C X). En virtud de la definición de A, tenemos que M = 
Uy YAA U Va Sea W, = (Xe M:X C Ay). Demostraré que W, = U,. 
Obsérvese que si Ve V,, VWMA % Y y que si Ue U,, ANMU % Y. Ello 
implica que si Ve V,, Vy 2 U,. En efecto, o bien f(V) e A, en cuyo caso 
WMA Cc Vi, y V, contiene elementos que no pertenecen a Á ni, por ende, a 
ningún U e U,, o bien f(V) £ A, en cuyo caso AXU C V,, para cada U e 
Uy Como Vi € M (por C2), tenemos que V; € (Aj U V,. Por la misma 
razón, si F CV, NFe [Aj U Y, Por otra parte, Ay e W,, y si % CM, 
NFAW e W,. Por consiguiente, W, U [AF U V, es una f-cadena en M, de 
suerte que M c (W, U (4) U Y) < M. Por lo tanto, (W, U (4) UYV,) = 
M=(U, VA) UTV,). SiXe MXe W, OXgz (A) UV,SXe Us 
Por lo tanto, U, = W,. 

Este resultado nos permitirá probar que para todo Ae A, Ay € A, de modo 
que A cumple la condición C2. Sean U,* =(Xe M: X4 Ay A XCAy) y 
V,¡F=(Xe M: X 4 Ay n Ay X). Obviamente V,* = (A) U V, y U, = 
YU Y Ay). Por lo tanto, M = U,* VIA) UV, y Aye A. 

Para comprobar que A cumple también la condición C3, considérese un 
conjunto cualquiera P < A. Si Xe MNXATY, o bien existe un Y e T tal que 
AT < Y <X, o bien X < Y para todo Y e T y por ende X < AT. Esto indica 
que MIT e A, como exije C3. 


Esta nomenclatura no está exenta de peligro. En la p. 109, línea 10 del texto original, 
el tipógrafo de Mathematische Annalen escribió “M” en lugar de “M”. El mismo error 
se repite, triplicado, en la traducción inglesa de van Heijenoort. Espero que el invento 
de la computadora de mesa, que me permite componer yo mismo este libro para la 
imprenta a medida que lo voy redactando, protegerá al lector contra este riesgo. 
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A cumple, pues, todos los requisitos para ser una f-cadena de M. Así queda 
demostrado que A = M. Escribo “Y > X” para decir que Y incluye a X como 
una parte propia (X < Y n X % Y). En virtud de la misma definición de A, es 
claro que, si A y B son dos elementos distintos de A = M, o bien A > B, o 
bien A > B. M está, pues, ordenado linealmente por la relación >. (M,>) es 
un conjunto bien ordenado, puesto que cumple las condiciones BO1, BO2 y 
BO3 del Apéndice I. En efecto, (M,>) tiene un primer elemento, a saber, M, 
cada He M tiene un sucesor inmediato, a saber H, y; por último, si FM 
tiene sucesores en (M,>) (vale decir, si VD £ F), NF e M es el sucesor 
próximo de F. 

Para demostrar que f aplica M biyectivamente sobre M, Zermelo usa un 
argumento muy ingenioso. Muestra primero que si Y * P C M, hay un y 
sólo un conjunto Pe M tal que f(P,) € P < P,. Reemplazando P por (kj 
en este resultado preliminar, se sigue que, para cada ke M hay un único K, 
e M tal que f(K,) e (k) < K,, esto es, tal que f(K,) = k. El resultado pre- 
liminar se establece así: Sea VD + PE MyP,=[MXe M:P <X).P, € 
M (por C3) y f(Pj) € P, ya que, si £(Po) € P, PE PSP) y Po no es 
la intersección de todos los elementos de M que incluyen a P. Por otra parte, 
si PCP,e€ My P,% Pp, P,> Pp, de modo que f(P,) £ P,. Como P <P, 
FP) £ P. Así, P, resulta ser el único X e M tal que fX) e PC X. 

Como el selector f restringido a M es biyectivo, induce en M el buen 
orden de (M,>)», según expliqué en el Capitulo 1.7. Zermelo prueba además 
que el buen orden determinado de este modo en un dado conjunto M por un 
dado selector f: PM > M es único. Supongamos, en efecto, que (M,<) es 
un conjunto bien ordenado de tal modo que, para cada A C< M, f(4) es el 
primer elemento de (A,<). Entonces, cada k e M determina una parte de M 
formada por k y sus sucesores. Sea H, = [xe M: k< x). Es claro que k = 
F(H). Sea H = (H,: ke Mj. Para cada P < M hay un y sólo un H, e H tal 
que f(P) = F(Hp). H, contiene el primer elemento de P y todos sus suceso- 
res y, por ende, cumple la condición f(Hp) e P < H)». No es difícil compro- 
bar que H cumple las condiciones C1, C2 y C3. En otras palabras, H es una 
f-cadena de M. Sea M, como antes, la intersección de todas las f-cadenas 
de M. Sabemos que, si Ze H, hay un y sólo un U e M tal que F(U) € Z< 
U. Como M c H y Z mismo es el único X e H tal que f0O) € Zc X, 
tenemos que U = Z. Por lo tanto, H = M y el orden < es precisamente el 
buen orden inducido en M por el selector f restringido a M. 
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VI 


LOS AXIOMAS DE ZERMELO 


Doy enseguida una traducción de los siete axiomas para la teoría de conjun- 
tos formulados por Ernst Zermelo (1908b). En el artículo original el enun- 
ciado de los axiomas está enmarcado en explicaciones que en lo esencial he 
reproducido en la Sección 1.8.1. Allí traduje la definición del término definit 
utilizado en el Axioma III. Es oportuno advertir que Zermelo escribe € en 
vez de C, O en vez de Y, UT en vez de PT, y ST en vez de UT. 


AXIOMA I 


AxIoMA II 


AxIoMA III 


AxIO0MA IV 


AXIOMA V 


Si cada elemento de un conjunto M es a la vez un elemento de 
un conjunto N y vice versa, o sea, si M <N y NC M, enton- 
ces M = N. En suma, cada conjunto está determinado por sus 
elementos. (Axioma de Determinación). 


Hay un conjunto (impropio), el conjunto vacío (Y, que no con- 
tiene ningún elemento. Si a es una cosa cualquiera del domi- 
nio, existe un conjunto (a) que contiene a a y sólo a a como 
elemento. Si a y b son dos cosas cualesquiera del dominio, 
existe un conjunto La, b) que contiene como elementos a a y 
b, pero no a otra cosa diferente x. (Axioma de los conjuntos 
elementales). 


Si la proposición universal E(x) está bien definida (definit) para 
todos los elementos de un conjunto M, M posee siempre un sub- 
conjunto Mg que contiene como elementos a todos los elemen- 
tos x de M para los cuales G(x) es verdadera, y sólo a ellos. 
(Axioma de Separación). 


A cada conjunto T le corresponde un segundo conjunto PT (el 
conjunto potencia de T), que contiene como elementos a todos 
los subconjuntos de T, y sólo a ellos. (Axioma del Conjunto Po- 
tencia). 


A cada conjunto T le corresponde un conjunto UT (el conjunto 
unión de T), que contiene como elementos a todos los elemen- 
tos de los elementos de T, y sólo a ellos. (Axioma de Unión). 
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AxIoMA VI Si T es un conjunto todos cuyos elementos son conjuntos no 
vacíos que no comparten elementos,” la unión UT incluye? al 
menos un subconjunto S, que tiene con cada elemento de T un 
y sólo un elemento en común. (Axioma de Selección). 


AxioMA VII El dominio contiene al menos un conjunto Z que contiene como 
elemento al conjunto vacío y está constituido de tal modo que 
a cada elemento suyo a le corresponde otro elemento de la 
forma (a), o que junto con cada elemento a contiene también 
como elemento el conjunto correspondiente (a). (Axioma del 
Infinito). 


VI 


INDEPENDENCIA DEL AXIOMA DE SELECCIÓN 
(FRAENKEL 1922a) 


Para demostrar que una proposición q es independiente de un conjunto de 
proposiciones I' se concibe una situación objetiva en la cual se cumplen las 
proposiciones de TI”, pero q es falsa. Una situación objetiva en la que se 
cumplen todas las proposiciones de I” se llama un modelo de IT. Para demos- 
trar que el Axioma VI de Zermelo es independiente de los Axiomas -V y 
VII, Fraenkel (1922a) propone un modelo cuyo dominio % consta exclusi- 
vamente de estos objetos: (1) el conjunto vacío WD; (11) una colección infinita 


La frase “no comparten elementos” corresponde a la expresión “untereinander elementen- 
fremd sind” utilizada por Zermelo. Debe entenderse que los elementos de T son mu- 
tuamente disjuntos por pares, esto es, que si A y B son elementos de T, o bien A = B, 
obinAMB=4Y. 

Zermelo usa aquí, para expresar la relación entre un conjunto y sus subconjuntos, el 
mismo verbo alemán “enthalten” con que expresa la relación entre un conjunto y sus 
elementos en los Axiomas II, HI, IV, V y VIL Para distinguir las dos relaciones, tra- 
duzco “enthalten” por “incluir? en el presente pasaje y por “contener” en los otros. 
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pero enumerable de objetos distintos, a,, 4; , 4,, 4, . . . , ninguno de los cua- 
les es un conjunto; (11) el conjunto Z, = (9, (9), (DP), ... $ postulado 
por el Axioma VII; (iv) el conjunto A = ((a,, a), La,, az, ... y; y (v) to- 
dos los conjuntos que existen en virtud de los Axiomas I-V si existen los 
objetos descritos en las cuatro cláusulas anteriores. Todos los objetos de Y, 
excepto los mencionados en la cláusula (11), son conjuntos y pueden cons- 
truirse a partir de los “objetos primitivos” mencionados en las cláusulas (1), 
(11) y (111) mediante un número finito de aplicaciones de los Axiomas I-V. 

Para facilitar la exposición, Fraenkel introduce algunos términos. El con- 
junto (a,, a,y se llama la celda A,, con elementos conjugados a, y a, (k > 1). 
Un conjunto principal es un conjunto que difiere de A a lo sumo por la 
ausencia de un número finito de celdas. Si M es un conjunto cualquiera, el 
conjunto M' conjugado con M respecto de la celda A, es el conjunto que 
difiere de M solamente en cuanto cada elemento de A, que entra en la cons- 
trucción de M ha sido sustituido por su elemento conjugado. Si M = M*, 
decimos que M es simétrico respecto de A,. Si el conjunto M es simétrico 
respecto de todas las celdas de un conjunto principal diré que M es idóneo 
(Fraenkel no se vale de este término). Es fácil ver que todos los objetos 
primitivos postulados en las cláusulas (1)-(111) son idóneos: en efecto, cual- 
quiera que sea el entero positivo k, un intercambio entre a, y a, en nada 
afecta a los conjuntos WD, Z, y A; por su parte, a, y a, son obviamente simé- 
tricos respecto de todas las celdas del conjunto principal AXía,, ay. Diré 
asimismo que una función q (en el sentido de Fraenkel 1922a explicado en 
la Sección 1.8.2) es idónea si existe un conjunto principal B, tal que, para 
todo k > 1, si A, € B,, entonces, para todo x, p(x,) es el conjunto conjugado 
con q(x) respecto de Aj. 

La falsedad del Axioma de Selección en el modelo propuesto es una con- 
secuencia inmediata de la siguiente “proposición fundamental”, verdadera en 
dicho modelo: 


PF. Todo conjunto es idóneo. 


En efecto, si el Axioma de Selección es verdadero, existe un conjunto S que 
“Selecciona” un y sólo un elemento de cada celda en el conjunto A y eviden- 
temente $ no puede ser simétrico respecto de todas las celdas de un conjun- 
to principal. 
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La verdad de PF en el modelo de Fraenkel resulta de cinco lemas que me 
limito a enunciar: 


E Si M es un conjunto, también existe el conjunto conjugado M* (para 
cada entero positivo k). 

IL. Si M es un conjunto construido a partir de conjuntos idóneos por 
aplicación de los Axiomas II, IV y V (exclusivamente), M es idó- 
neo. 

TIL Sea q una función que se define sustituyendo por una variable al- 


guno de los conjuntos idóneos presupuestos en la construcción del 
conjunto M mencionado en el lema II. Entonces q es una función 
idónea. 

IV. S1Q y y son funciones como la descrita en el lema lll y M es un 
conjunto idóneo, entonces también son idóneos los subconjuntos de 
M determinados por las condiciones p e y y q £ y conforme al 
Axioma III (en la versión de Fraenkel reproducida en la Sección 
1.8.2). 

v. Si en el enunciado de las condiciones del lema IV el conjunto M o 
uno de los argumentos de las funciones p o y es reemplazado por 
una variable, la condición y e y (o la condición p £ y) determina 
una función idónea y. 


No es difícil probar que los cinco lemas son verdaderos en el modelo con- 
siderado (de hecho, Fraenkel sólo estima necesario dar pruebas del II y el 
IV). PF se deriva luego por inducción sobre la “clase” de cada objeto o fun- 
ción de 9. Este concepto de “clase” se define recursivamente así: 


[0] Un objeto de Y es un objeto de clase O si es uno de los objetos 
primitivos mencionados en las cláusulas (1) (111) o se construye por 
aplicación de los Axiomas II, IV y V a objetos primitivos. Una 
función definida sustituyendo por una variable alguno de los obje- 
tos primitivos presupuestos en la construcción de un objeto de cla- 
se O es una función de clase 0. 

[n=> Siel conjunto M y las funciones q y y son de clase <€ n y M' es el 

n+1] subconjunto de M determinado conforme al Axioma III por la con- 
dición y e y o por la condición p £ y, M' es un conjunto de clase 
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< n+l. Si y es la función determinada en tal caso por la condición 
p € yo por la condición p £ y cuando el conjunto M o uno de 
los argumentos de las funciones p o y es reemplazado por una 
variable, x es una función de clase < n+1. 


El argumento inductivo procede así: Todo objeto de clase < 1 es idóneo en 
virtud de los lemas I y IV y toda función q de clase < 1 es idónea en virtud 
de los lemas III y V. Supongamos que se ha establecido que todos los obje- 
tos y funciones de clase < n son idóneos. Entonces el lema IV implica que 
todo objeto de clase < n+1 es idóneo y el lema V implica que toda función 
de clase < n+1 es idónea. 

A propósito de esta prueba de independencia es oportuno hacer algunas 
observaciones. Ella demuestra que el Axioma de Selección es independiente 
de los demás axiomas del sistema de Zermelo (1908a), con el Axioma III 
ajustado a la formulación de Fraenkel 1922a (Sección 1.8.2). Pero no se ha 
demostrado que el Axioma de Selección sea independiente del restante siste- 
ma de Zermelo enriquecido con el Axioma de Reemplazo propuesto en 
Fraenkel 1922 (Sección 1.8.3). De hecho, Fraenkel pensó en un comienzo 
que el Axioma de Selección se podía inferir de dicho sistema enriquecido. 
Por otra parte, si “función” se entiende en el sentido de Fraenkel 1922a, el 
Axioma de Reemplazo no fortalece el sistema original de los Axiomas I-V 
y VII de Zermelo sino que se infiere de ellos (von Neumann 1928). El mo- 
delo de los Axiomas 1-V y VII utilizado en la prueba de independencia com- 
prende, como hemos visto, infinitos objetos que no son conjuntos. Como 
indiqué en la p. 75, nota 5, tales objetos se conocen en la literatura matemá- 
tica por su nombre alemán de Urelemente. Zermelo estimaba que la teoría 
de conjuntos debía postular su existencia para que la matemática se pudiera 
aplicar al mundo real, en el cual hay por cierto muchas cosas que no son 
conjuntos. Pero la matemática pura puede vivir muy bien sin Urelemente. 
Por lo demás, tampoco los necesita la matemática aplicada, si lo que hace es 
representar realidades naturales mediante objetos ideales que perfectamente 
pueden ser conjuntos. En 1963 Paul Cohen demostró, sin presuponer Urele- 
mente, que el Axioma de Selección es independiente de los axiomas restan- 
tes de Zermelo suplementados con el Axioma de Reemplazo (en la versión 
fuerte de Skolem). 
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VII 


LA DEFINICIÓN POR INDUCCIÓN TRANSFINITA 
(VON NEUMANN 1928a) 


La inducción matemática (finita) es el arma principal de la aritmética. Una 
demostración inductiva establece que todos los números naturales tienen una 
propiedad P, probando (a) que el número O tiene la propiedad P y (b) que, 
si un número cualquiera n tiene la propiedad P, también la tiene su sucesor 
inmediato n+1. En el penúltimo párrafo del Apéndice VII hay un ejemplo de 
este método de demostración. Una definición por inducción (o definición 
recursiva) determina la extensión C de un concepto aplicable a objetos de 
cierta categoría K, por “estratos”, como sigue:? 


(69) Se estipula que cierta parte de K constituye el estrato básico C;. 
(11) Se fija una relación funcional!” q entre las partes de K y se estipu- 
la que si n es cualquier número natural y el estrato C,, tiene la re- 
lación y con una parte 4C,, de K, el estrato C,,, = C, U 0C,,. 
(11) C se define como la unión de todos los estratos C,,. 


Dedekind fue el primero en comprender que la definición por inducción 
sólo es admisible si la sucesión de estratos C,, (n e N) queda unívocamente 
determinada con sólo fijar el estrato básico C, y la relación q. La unicidad 
de los estratos y, por ende, de su unión C está garantizada por el siguiente 
teorema, que Dedekind (1888, 1126) demuestra inductivamente: Dado un 
triple (W, wo, 4), donde W es un dominio de objetos, w, es un objeto distin- 
guido de W y q es una aplicación de W en W, existe una sola aplicación f: 
N > W tal que f(0) = w, y para cada ne Ni, f(n+1) = d(f(n)). Sea W= PK 


Acabamos de ver una definición recursiva (de “clase”) en el Apéndice VIL Hay otras 
dos en las pp. 78 y 81. El Apéndice IX contiene definiciones recursivas de “término”, 
“predicado”, “fórmula”, *verdad/falsedad” de una fórmula en una interpretación, etc. Con- 
viene examinar dichos ejemplos a la luz de la explicación que doy aquí. 

Una relación diádica R se dice funcional si la conjunción Rxy A Rxz implica que y = 2; 
en otras palabras, si la relación R admite un solo terminus ad quem para cada terminus 
a quo. 
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y W, = Co. Entonces, debido a la existencia y unicidad de la aplicación f 
descrita en el teorema, hay una y sólo una aplicación de N en W, k > Cy, 
tal que para cada ne N, C,,,, = f(n) U C,,. Esto asegura la unicidad de la 
unión E = UC 

La demostración inductiva se puede extender al transfinito. Se demuestra 
por inducción transfinita que cada ordinal tiene una propiedad P, probando 
(a) que el O tiene la propiedad P y (PB) que, si todos los ordinales menores 
que un ordinal cualquiera £ tienen la propiedad P, también la tiene 8. 

También hay un método de definición por inducción transfinita, que cons- 
truye la extensión de un concepto C por estratos Co, Cy Ca... 3 Co Cosp >. 
correspondientes a los ordinales. Parafraseando a Hausdorff (1914, p. 113), 
este género de definición se puede caracterizar así: 


C, está definido para todo ordinal k si 


(1) C, está definido y 
(11) para cualquier ordinal a, C.,, queda definido mediante la definición 
de C¿ para todo E <a. 


Aunque este método de definición se utiliza implícitamente desde los albo- 
res de la teoría de conjuntos, von Neumann parece haber sido el primero 
que juzgó necesario justificarlo. En la exposición siguiente seguiré a von 
Neumann 1928c. Imitando al autor, me expreso en términos de una teoría de 
conjuntos “ingenua”, pero fácilmente adaptable al sistema ZF. La caracteri- 
zación precisa de la definición por inducción transfinita se facilita mucho 
gracias al concepto de ordinal de von Neumann 1922. Recordemos que un 
ordinal así concebido es un conjunto a: bien ordenado por la relación e , de 
modo que cada elemento de a. contiene a todos sus predecesores; el sucesor 
de a es el conjunto a. U (a); el primer ordinal es 0 = Y (Sección 1.8.4). 
Llamaré *Y —con Zermelo— al dominio de la teoría de conjuntos y (2 — 
con Cantor— al subdominio constituido por los ordinales (von Neumann lo 
llama OZ). Si f es una aplicación de (Q, o de un segmento de Q, en Y y a 
es un ordinal, llamaré con von Neumann F(f,a) al grafo de la restricción de 
f ao; en otras palabras, F(f,a) = (8 ,F(8)): € e a). Von Neumann demues- 


A En el Apéndice XI doy una demostración y ejemplos de aplicaciones del Teorema de 


la Definición por Inducción de Dedekind. 
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tra el siguiente Teorema de la Definición por Inducción Transfinita (TDIT), 
visiblemente similar al teorema de Dedekind (1888, 4126) enunciado arriba: 


Si p es una aplicación definida en Vx YB hay una y sólo una apli- 
cación f: (0 > Y tal que para cada ordinal E, f(€8) = p(F(F,8),5). 


No es difícil ver que el TDIT legitima la definición por inducción transfinita. 
Recordemos que cada estrato C¿ (8 > 0) de la extensión C de un concepto 
definido por este método queda definido por la colección (C¿: € e Ey de los 
estratos anteriores. La regla que coordina cada estrato con los que le prece- 
den puede representarse, pues, mediante una aplicación q: Bx Y > Y, tal 
que (0,0) = C, y, para cada ordinal € > 0, C¿ = p(((E,C¿): E € EE). En 
virtud del TDIT, la aplicación £ +> C; existe y es única. El definiendum C 
puede entonces identificarse con la unión de los estratos C¿: C = U¿¿gC:. 

Ahora bosquejaré la demostración de von Neumann. Diremos que un 
ordinal € es normal si, dada una aplicación q: Bx Y —> Y, existe una apli- 
cación f.: E > Y tal que para cada E e E, f¿(€) = p(F(f¿,5),5). Llamaré, 
con von Neumann, “elemento funcional hasta €” a una aplicación f¿ como 
la descrita. Von Neumann demuestra (I) que dados q y € no puede existir 
más que un elemento funcional hasta €. Por lo tanto, si £ es normal, la ex- 
presión p(F(f¿,5),5) designa exactamente un objeto del dominio 28.13 Así pues, 
la correspondencia € > p(F(f¿,5),5) asigna un y sólo un objeto f(8) a cada 
ordinal normal £. Von Neumann demuestra (II) que todo ordinal es normal. 
Por lo tanto, dada la aplicación q, existe una única aplicación f: Q > Y tal 
que para cada ordinal €, f(É) = p(F(f¿5),5). Q.E.D. 

La proposición (I) se prueba así: Sea £ un ordinal normal y f: y 82 
dos elementos funcionales hasta €. Es claro que si f. + g¿ hay uno o 
más ordinales € mayores que O y menores que ¿£ tales que f¿(8) * g¿(6). 
Sea Ey el menor de estos ordinales. Como f¿(n) = 2¿(m) para todo ordinal 
n € 5g, tenemos que, contra lo que se había supuesto, f£¿(5p) = p(F(£250).50) 


Por cierto, podría representársela también, más sencillamente, mediante una aplicación 
yw: Y > Y tal que y(0) = C, y, para cada ordinal E > 0, C¿ = w(C¿: € e E). La 
representación arriba descrita fue elegida por von Neumann con vistas a la demostra- 
ción del TDIT. 

Recuérdese que F(f:,5) = (E, f(0): € € E), de suerte que esta expresión está bien 
definida si f¿ es una aplicación definida en £. 
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= ¿An f¿m)): n € Cor Lo) = PA gm): n € Cor Lo) = Ps: L 0) = 
8¿(50). Por lo tanto, f¿ = 8;. 

La proposición (II) se infiere casi inmediatamente de las proposiciones 
siguientes: 


(1D) Si € es un ordinal normal y € e €, € es normal y p(F(f¿5),5) = 
P(F(F:,0),0); 


(1v) Si todo ordinal £ e £ es normal, € es normal. 


Para probar (III) suponemos que £ es normal y designamos con fe la 
restricción de f¿ a € e E. Si n es cualquier ordinal menor que €, f¿I(m) = 
(ms FF) = EEE). Por lo tanto, E es normal y f, = f.L. 
Es claro, pues, que FFLDE) = PEEIOS = OFELOS. 

(IV) se prueba así: Sea £ un ordinal tal que si £ e €, € es normal. En 
virtud de los resultados ya obtenidos, existe entonces para cada € e £ un 
objeto único f¿(E) = p(F(£¿6),6). E > f¿(6) es, pues, una aplicación defini- 
da en £.!* En particular, por P3, sin e L[ e €, fín) = of, 1) = 
p(F(f¿nm).n), de suerte que para todo € € E, F(£,5) = F(f¿05), lo cual impli- 
ca a su vez que 


LO) = AFD = PELO 


Como sabemos, esto significa que € es normal. 

Para probar (II) suponemos que es falsa y que existe un ordinal a. que no 
es normal. Entonces, por (1V), no son normales todos los ordinales € tales 
que £ e a.. Von Neumann muestra que los ordinales no normales que son 
elementos de a. constituyen un conjunto 4 + Y, el cual tiene, por lo tanto, 
un primer elemento €. SiS € Ep, E € AMA; luego, € es normal. Pero en- 
tonces (IV) implica que £¿ es normal. ¡Contradicción! 


Von Neumann dedica una larga nota a demostrar, en términos adaptables a la teoría 
axiomática ZF, que la aplicación € > B definida por E > f¿(É) = (0,6) efecti- 
vamente existe si todo € < £ es normal (1928a, pp. 389s., n. 28). Pero a la luz de lo 
que llevamos dicho su existencia debiera resultar obvia desde un punto de vista “inge- 
nuo”. 
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IX 


EL CÁLCULO PREDICATIVO 


Cálculo predicativo es el nombre genérico de los lenguajes artificiales o 
“escrituras conceptuales” (cf. Capítulo 2.2) utilizados en la lógica y la mate- 
mática actuales. Distinguimos entre cálculos de primer orden, en los que es 
posible representar formalmente generalizaciones relativas a objetos indivi- 
duales (vgr. “hay una montaña en América que es más alta que todas las 
montañas de Europa”), y cálculos de orden superior, en los que además pue- 
den representarse generalizaciones relativas a propiedades y relaciones (vgr. 
“hay una relación X que cualquier entero positivo z mayor que 3 tiene con 
algún número primo menor que z”). En los cálculos de segundo orden se 
representan generalizaciones relativas a individuos y a propiedades y rela- 
ciones de individuos; en los de tercer orden, se representan asímismo gene- 
ralizaciones relativas a propiedades y relaciones de tales propiedades o rela- 
ciones, etc. 

A continuación presento la gramática —sintaxis y semántica— común a 
toda una familia de cálculos predicativos de primer orden. Para facilitar la 
comprensión, presento primero reglas para cálculos sin signo de identidad, 
que llamo versiones del CP1, y luego enuncio reglas adicionales para cálcu- 
los con signo de identidad, que llamo versiones del CP1=. Enseguida, bajo 
el título “Decisión y deducción”, considero dos vías para determinar cuáles 
son las fórmulas del CP1= que según nuestras estipulaciones semánticas 
representan verdades lógicas. Por último, me refiero brevemente a una fami- 
lia de cálculos predicativos de segundo orden con identidad, que llamo CP2=. 

En el curso de la exposición, se definen diversas categorías sintácticas 
(términos, fórmulas, etc.). Generalmente, la definición es recursiva: se fija 
primero una base formada por uno o más objetos bien definidos pertene- 
cientes a la categoría en cuestión; luego se describe un procedimiento bien 
determinado para construir nuevos objetos de esa categoría a partir de obje- 
tos ya reconocidos como tales. Se sobreentiende que todo objeto de la cate- 
goría así definida satisface uno de estos dos criterios de definición y que 
aquellos objetos que no pertenecen a la base se generan desde ella mediante 
un número finito de aplicaciones del procedimiento descrito. Consíderese, por 
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ejemplo, la definición de variable bajo el acápite Vocabulario en la sección 
A: el objeto x es una variable (éste es el único elemento de la base); si un 
objeto dado £ es una variable, se forma una nueva variable agregando el 
palote ¡ a la derecha de 8; por lo tanto, un objeto cualquiera es una variable 
si y sólo si ese objeto es el signo x, o es el signo x seguido de un número 
finito de palotes. Me parece que este es el modo natural de entender una 
definición así y por eso, a diferencia de otros autores, me doy por contento 
con la presente advertencia general y no la repito en cada caso. 


A. SINTAXIS 


Las expresiones del CP1 están formadas por secuencias finitas o filas de sig- 
nos tomados de una lista finita o alfabeto de ideogramas y letras.!* Si la fila 
y es una secuencia de n signos (n > 0), decimos que n es la longitud de n; 
simbólicamente, A(n) = n. Decimos que la fila n es más breve que la fila E, 
si An) < A(E). Si A(n) = m y A(E) = nm, $ € es la fila de longitud m + n 
cuyo h-ésimo signo es el h-ésimo signo de n (1<hA<m) y cuyo (m+k)-ésimo 
signo es el k-ésimo signo de £ (1<k<mn). En vez de n E escribiré simple- 
mente n£. 


El alfabeto. El alfabeto del CP1 consta de los siete ideogramas —=, >, V, (, 
), 1, Y, y de las tres letras x, a, P. Los ideogramas se llaman, respectivamen- 
te, signo de negación, signo de implicación (o flecha), signo de cuantificación 
universal, paréntesis izquierdo, paréntesis derecho, palote y asterisco; pero, 
en aras de la brevedad, los usaré a ellos mismos para nombrarlos. Por ejem- 
plo, si n es una fila de longitud 3 y € es una fila de longitud 2, (n;¡, > 6) es 
la fila de longitud 10 formada por un paréntesis izquierdo seguido del pri- 
mer, segundo y tercer signo de n (en ese orden), seguidos de dos palotes, 
seguidos de una flecha, seguida del primer y segundo signo de £, seguidos 
de un paréntesis derecho. Los signos — y —> suelen llamarse conectivos. 


[Obsérvese que, según las convenciones introducidas en los dos últimos pá- 
rrafos una fila D de letras griegas entremezcladas o no con ideogramas del 


Le Algunos autores dicen “cuerda” de signos en vez de “fila”, pero me parece esa una tra- 


ducción demasiado literal y poco expresiva del término inglés “string”. 
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cálculo representa una colección infinita de filas de signos del cálculo, espe- 
cificada por la estructura de D. Por ejemplo, la fila (a —> VB) representa 
todas las filas de signos del cálculo que empiezan con (, terminan con ) y 
contienen la fila >V entre dos filas cualesquiera (de longitud > 0). Cuando 
atribuyo propiedades sintácticas o semánticas a una tal fila Dd, debe enten- 
derse que la aseveración se refiere a cada fila representada por Q.] 


Vocabulario. Las expresiones del CP1 combinan ideogramas con palabras 
formadas conforme a ciertas reglas precisas. Distinguimos dos clases princi- 
pales de palabras del CP1. 


(1) Términos: En el CP1 hay dos clases de términos, llamados variables y 
constantes. 
La letra x es una variable. Si £ es una variable, €, es una variable. 
La letra a es una constante. Si (y es una constante, (), es una constante. 
(11) Predicados: Distinguimos, para cada número natural n > 0, la clase de 
los predicados n-ádicos. (Suele llamárselos variables proposicionales si 
n = 0, predicados monádicos si n = 1 y predicados poliádicos si n > 1). 
La letra P es un predicado 0O-ádico. 
Si TT es un predicado n-ádico, Tr, es un predicado n-ádico. 
Si tí es un prédicado n-ádico que no contiene palotes, 1% es un predi- 
cado (n+1)-ádico. 


Una versión del CP1 incluye siempre todas las variables y todos los predi- 
cados O-ádicos.'? Incluye además una parte de las constantes y una parte de 
los predicados n-ádicos para uno o más valores de n > 0. (Las partes en 
cuestión pueden ser propias o impropias y aun vacías). El conjunto de las 
constantes y predicados n-ádicos (n > 0) de una dada versión del CP1 cons- 
tituye lo que llamaré el léxico de esa versión. Obsérvese que cada versión se 


Como se verá en la sección C. Tautologías, los predicados O-ádicos sirven para repre- 
sentar fórmulas indeterminadas y, por ende, las proposiciones expresables con ellas. 
De ahí el nombre de variables proposicionales que, como dije, suele dárseles (con cierta 
impropiedad). Por eso también se llama Cálculo proposicional al fragmento del cálcu- 
lo predicativo que puede construirse utilizando solamente predicados O-ádicos, conectivos 
y paréntesis (estos son los únicos ingredientes de las fórmulas del CP1 que llamaré 
verifuncionales; véase su definición en la sección C). 
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distingue de las demás únicamente por su léxico.!” Una versión del CP1 con 
léxico £, es una extensión de otra con léxico £, si y sólo si £, < £,. La 
versión cuyo léxico contiene todas las constantes y todos los predicados n- 
ádicos (n > 0) del CP1 es la máxima extensión posible de cualquier otra 
versión. La llamo la versión máxima del CP1. Su léxico, £,,,., es el léxico 
máximo. 

Sean n y € dos filas de signos (posiblemente de longitud 0) y sea O la fila 
n a E, donde a. es una variable, una constante o un predicado. Suponga- 
mos que € no comienza con un palote ni con un asterisco. Diremos entonces 
que la fila € determina una posición en O y que a figura en O en la posición 
determinada por €, o que a. ocupa en 0 la posición que precede a £.!* Una 
misma variable, constante o predicado puede figurar en varias posiciones en 
una fila dada; estas posiciones se numeran —primera, segunda, tercera, ... — 
según decrece la longitud de la fila que las determina. 


Fórmulas. Una fila de signos formada por un predicado n-ádico seguido de 
n términos es una fórmula elemental. Toda fórmula elemental es una fórmu- 
la. Sia. y B son fórmulas y £ es una variable, también son fórmulas las filas 
de signos descritas a continuación: 


[F_] =0L 
[PA (a > B) 
[Ey] Vóa 


La fila WE es un cuantificador (universal) que liga la variable €. El alcance 
del cuantificador W¿ en la fórmula Vóáa es precisamente la fórmula a. que 
comienza inmediatamente a la derecha del mismo. Por aplicaciones repeti- 


Chang y Keisler, en su espléndida Model Theory (tercera edición, 1990), llaman “len- 
guaje” (language) a lo que yo llamo “léxico”. Ambas denominaciones se salen del uso 
común del respectivo vocablo, pero la adoptada por ellos me parece menos afortunada: 
si aprendo una palabra castellana que antes desconocía y al mismo tiempo me olvido 
de otra, no diríamos que he cambiado de lenguaje sino que ha variado mi léxico. 


Exigimos que € no comience con palote ni asterisco para que no se pueda decir que la 
variable (constante, predicado) a. figura en una cierta posición en 8 cuando aparece allí 
formando parte de otra variable (constante, predicado). Conforme a nuestra estipula- 
ción, el predicado P** no figura en ninguna posición en la fórmula P***x, xx, y la 
variable x, figura en una sola, a saber, la determinada por la fila x,;,. 
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das de la regla [F,], puede obviamente ocurrir que una fórmula dada con- 
tenga más de un cuantificador que ligue a la misma variable. Sea B una fór- 
mula en que figura una variable £. Ésta puede ocupar tres tipos de posicio- 
nes en 3: (A) inmediatamente a la derecha de un signo de cuantificación; 
(B) dentro del alcance de uno o más cuantificadores que ligan a ¿; (C) fuera 
de todo cuantificador y también fuera del alcance de todo cuantificador que 
ligue a €. Diremos que £ está libre en [B en cada posición del tipo C y que 
tal posición es una posición libre de € en PB. Diremos que € está ligada por 
un determinado cuantificador que liga a € (1) en la posición que ocupa den- 
tro de él y (11) en cada una de sus posiciones libres dentro del alcance de ese 
cuantificador.!” Una fórmula que contiene una o más variables libres se dice 
abierta. Una fórmula que no contiene ninguna variable en una posición libre 
se dice cerrada. La clausura universal de una fórmula a. que contiene las 
variables libres £,,....¿, (numeradas según el orden de su primera apari- 
ción en a) es la fórmula cerrada VE, ...VE,a. 

Si a y PB son fórmulas, decimos que $ es una subfórmula de a si A. = 
n PB“, donde n y € son filas de signos (posiblemente de longitud 0) y € no 
empieza con un palote o un asterisco.? En tal caso, decimos también que $ 
ocupa en a la posición determinada por €, o que precede a £. 

A veces hay que reemplazar en una fórmula dada una cierta variable libre 
por otro término (variable o constante). Nos conviene tener una expresión 
simbólica concisa que denote en nuestro idioma el producto de esta opera- 
ción. Para evitar repeticiones, definiré tal expresión de modo que nos sirva 
no sólo mientras hablamos del CP1, en que todo término es idéntico a una 
constante o a una variable, sino también más tarde, al hablar de cálculos 
(como el CP1=) en que los términos pueden ser expresiones más complejas. 
Sea (p una fórmula, £ una variable y t un término del cálculo estudiado. 
Consideremos primero un caso sencillo: ninguna posición libre de € en y 
está situada dentro del alcance de un cuantificador que ligue alguna de las 


Por ejemplo, si la fórmula f es la fila yvéad y a es el alcance del cuantificador WE 
precedido inmediatamente por la fila y, W¿ sólo liga a € dentro de sí y en las posicio- 
nes libres de £ en aL, pero no liga a £ en ninguna de las posiciones que € ocupa en las 
filas y y O ni en las posiciones de £ en a. dentro de otro cuantificador que ligue a £ o 
dentro del alcance de tal cuantificador. (No se olvide que a. podría ser una fila kVE1). 


20 En virtud de la condición impuesta a £, las fórmulas P¡, , =P y P*x no son subfórmulas 


de la formula (PP, > P*x;y). 
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variables contenidas en T. Entonces, la expresión simbólica q, designa (en 
castellano) la fórmula obtenida al insertar t en vez de £ en todas las posicio- 
nes donde € está libre en q. Por cierto, si £ no figura en q o sólo figura en 
posiciones donde está ligada, q, = p. En el caso general, algunas posicio- 
nes libres de £ en q se hallarán posiblemente dentro del alcance de cuanti- 


ficadores que ligan a ciertas variables n;,...., n, que también figuran en el 
término T. Ordenemos las variables del cálculo según el número de palotes 
que contienen: Xx, Xj, Xi, Xy... Sean Ey, ..., €, las k primeras variables 


(en ese orden) que no figuran en la fórmula q ni en el término 1. Sea q” la 
fórmula que se obtiene al reemplazar n, por €, en todas las posiciones liga- 
das que n, ocupa en p (1<1<k). Entonces, la expresión q, designa la fór- 
mula obtenida al insertar t en vez de £ en todas las posiciones donde £ está 
21 z se 

libre en q”.* En forma análoga puede introducirse la expresión P. ave e 
para simbolizar el producto de la sustitución simultánea del v-tuplo de va- 
riables (8,,... £,) por el v-tuplo de términos (t,,.....,T,) en todas las posi- 
ciones libres que dichas variables ocupan en q. Suelo escribir d(t/£) en vez 


de Na y d(11/E,, ARA ES) en vez de Pr.....ty/E, ¿Ne Sy! 


B. SEMÁNTICA 


Como el lector habrá notado, las reglas sintácticas se refieren únicamente a 
signos y combinaciones de signos, esto es, a figuras inscritas en una pizarra 
o una hoja de papel (o, si se quiere, a los prototipos ideales de tales figuras), 
sin tener en cuenta lo que dichos signos significan. Las reglas semánticas se 
refieren al significado de las fórmulas construidas conforme a las reglas 
sintácticas. Específicamente, las reglas semánticas del CP1 establecen las 
condiciones necesarias y suficientes para que una dada fórmula de una ver- 
sión particular de CP1 sea verdadera relativamente a una cierta interpreta- 
ción de dicha versión. Sea, pues, CP17 una tal versión particular. Como ya 


21 En otras palabras: para transformar q en ele primero reemplazo en «q toda variable 


ligada que figure en T por una variable nueva, la primera que no figure en q ni en t; 
así obtengo la fórmula q”; luego reemplazo ¿ por í en todas las posiciones libres de € 
en q”. Doy un ejemplo. Sea y la fórmula Vx(P**x yx w 3x1 ¡P***xx,¡x,111). Entonces, la 
primera variable que no figura en q es x,; aplicando la receta antedicha, tenemos pues 
que Q y /x,, es la fórmula VPF xa Y IPR xp). 
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he indicado, el vocabulario de CP17 incluye todos los ideogramas, variables 
y predicados O-ádicos del CP1, más una selección bien definida de constan- 
tes y de predicados n-ádicos para ciertos valores de n > 0. Las reglas semán- 
ticas se formulan de modo que sean aplicables, como quiera que se haga esa 
selección. 

Sea Y una colección (no-vacía) de objetos cualesquiera. Sea Y el conjun- 
to de los términos y predicados del CP1j y sea % el conjunto de todas las 
fórmulas formadas con palabras de Y conforme a nuestras reglas sintácticas. 
Una interpretación del CP1+f es un par (%,f), donde Y un conjunto (no-va- 
cío) de objetos cualesquiera y f es una aplicación, definida en Y U *, que 
satisface las estipulaciones que se enuncian a continuación. (%W se llama el 
dominio de la interpretación; también se suele decir que f es una interpreta- 
ción en el dominio 9). 


[1] Para todo término te V, f(t) € Y. 

[HL] Para todo predicado 0-ádico Tn e V, f(x) e (0,1). 

[L,] Para todo predicado n-ádico re V (n > 1), f(T) c 9" (f(1) es un 
conjunto de n-tuplos de elementos de 9). 

[XL] Si a. es una fórmula formada por un predicado n-ádico Tr e Y segui- 
do de los términos T,,...., T,, fa) =0 si (f(T,), ... ft,)) € FT) 
—esto es, si el n-tuplo formado por los objetos que f asigna a los 
términos 1,,...., T, es uno de los n-tuplos comprendidos en el con- 
junto que f asigna al predicado T— y fla) = 1 si (f(t,),... F(,)) 
£ fm). 

[LL] Si a es la fórmula 8, fía) =0 si FB) = 1 y fla) = 1 si F(B) =0. 

[1]. Sia es la fórmula (B > y), fla) =0 si FB) = 16 F(y) =0, y f(a) 
= 1 sólo si (PB) =0 y F(y) = 1. 

[L,] Sea a la fórmula VEP. Diré que f' es una ¿-variante de (D,f) si f' 
es una interpretación de CP1j en Y y para cualquier predicado o 
término () % € perteneciente al vocabulario de CP17, f'(0) = f(w). 
Entonces, fía.) = 0 si para toda f' que sea una ¿-variante de f, F' (PB) 
=0; y fía) = 1 si hay una f', E-variante de (9%,f), tal que £(B) = 1. 


Una fórmula a es verdadera en la interpretación (%,f) si y sólo si f(a) = 
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0.2 De otro modo, a es falsa en la interpretación (D,f). Si hay al menos 
una interpretación (D,f) en la cual la fórmula a. es verdadera, decimos que 
a. es una fórmula realizable. Si a. es verdadera en toda interpretación, deci- 
mos que una fórmula a. es válida (o universalmente válida). Sí a. no es ver- 
dadera en ninguna interpretación decimos que a es irrealizable. Claramente, 
las fórmulas válidas representan lo que llamamos comúnmente verdades ló- 
gicas, aseveraciones verdaderas en todo caso, mientras que las fórmulas irrea- 
lizables representan aseveraciones lógicamente falsas, que bajo ninguna cir- 
cunstancia pueden ser verdaderas. Por eso, decimos a veces “fórmula lógica- 
mente verdadera (falsa) por “fórmula válida (irrealizable)”. Decimos asimis- 
mo que una fórmula a. es una consecuencia lógica o simplemente una con- 
secuencia de un conjunto de fórmulas A (simbólicamente, A E 0), si f(a.) = 
O en toda interpretación (9,f) tal que f(B) = O para cada fórmula f e A. Si 
AE a y el conjunto A contiene una sola fórmula PB, decimos también que a 
es una consecuencia de B (simbólicamente, BF a). Si a. es consecuencia de 
B y viceversa, esto es, si en toda interpretación (D,f), f(a) = F(B), decimos 
que a. y B son lógicamente equivalentes. Obsérvese que, en virtud de nues- 
tras definiciones, una fórmula a. es válida si y sólo si DE a. 


C. TAUTOLOGÍAS 


A principios de siglo solía usarse “tautología? como sinónimo de “verdad lógi- 
ca” (o de “fórmula válida”), pero aquí empleamos esa palabra en una acep- 
ción más restringida que procedo a explicar. 

Como el lector habrá observado, una interpretación (%,f) asigna a cada 
predicado 0-ádico un valor 0 ó 1, pero no le atribuye propiamente un signi- 
ficado. Por otra parte, con arreglo a nuestras estipulaciones, cada predicado 
O-ádico IT es una fórmula verdadera en (%,f) si F(ID) = O y falsa en f si 
FAO) = 1. Asímismo, una fórmula a. que sólo contenga predicados 0O-ádicos 
se llama verdadera o falsa en (%,f) según el valor de f(a), calculable de 


22 Obsérvese que, al revés de muchos libros de texto, asocio el número O a la verdad, el 


número 1 a su ausencia. Cualquier decisión en esta materia es, por cierto, arbitraria; la 
mía se inspira en palabras de la diosa que instruyó a Parménides, según las refiere 
Simplicio: 'AAmBeins evxvxAéoc drpeues itop (Parménides, fr. 1.11 DK). 


Apéndices 488 


acuerdo con [I_ ] y [L]. Aunque pueden parecer extravagantes y arbitrarias, 
estas prácticas tienen un sentido, como ahora veremos. También se entende- 
rá por qué exigimos que cada versión del CP1 incluya todos los (infinitos) 
predicados 0-ádicos. 

Digamos que una fórmula es una fórmula verifuncional sí en ella no figu- 
ran variables, constantes, predicados monádicos o poliádicos ni cuantifica- 
dores. En otras palabras, una fórmula verifuncional sólo puede contener pre- 
dicados O-ádicos, conectivos y paréntesis. Cada predicado 0O-ádico diferente 
que figura en una o más posiciones en una fórmula verifuncional a. es un 
componente de aL. El epíteto cacofónico pero consagrado *verifuncional” (del 
inglés truth-functional) se explica fácilmente. Sea (%,f) una interpretación 
del CP17. Si a es una fórmula verifuncional del CP1+ con componentes 
II,,....,1l,, es claro que f(a) está unívocamente determinado por f(I1,),...., 
fCUIT,), y en la jerga matemática esto suele expresarse diciendo que el valor 
veritativo (verdadero o falso) de a. depende funcionalmente del valor veritativo 
de sus componentes. 

Supongamos ahora que a. es una fórmula cualquiera. Sea $ una fórmula 
verifuncional cuyos componentes II,,... , II, (n= 1) no figuran en a. Deci- 
mos que f es un prototipo verifuncional de a si hay una lista de fórmulas 
diferentes (0L;, ... ,0L,) tal que a. es el resultado de reemplazar con 0., el com- 
ponente II, en todas las posiciones que II, ocupa en PB (1<k<mn). En tal 
caso diremos también que a. se deriva de B por reemplazo y que las fórmu- 
las 0.,,...,Q., son los componentes verifuncionales de a relativos al proto- 
tipo P. Obviamente el valor de a. en una interpretación (W,f) depende funcio- 
nalmente de f(a.,),...., fa,,). 

Ahora puedo explicar lo que en este libro se llama “tautología?. Una fór- 
mula o. de uno de los cálculos predicativos descritos en este apéndice es una 
tautología si y sólo si a. se deriva por reemplazo de una fórmula verifuncional 
válida PB (en cuyo caso, obviamente, f(a) = O cualquiera que sea el valor de 
f en los componentes verifuncionales de a relativos a B, y por ende también 
a. es válida). El uso del término se extiende por analogía a los cálculos predi- 
cativos de que se habla en el cuerpo del libro. 
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D. ACLARACIONES Y ABREVIATURAS 


Se advertirá que una interpretación (B,f) de una versión cualquiera CP17 
del CP1 asigna un objeto del dominio Y a cada término del CP1, el cual 
puede entonces considerarse como un nombre del objeto respectivo. Asigna 
asimismo una colección de objetos de Y a cada predicado monádico, una 
colección de pares de objetos a cada predicado diádico, una colección de 
tríos a cada predicado triádico, etc., de suerte que cada predicado monádico 
del CP1f viene a designar la propiedad de pertenecer a la respectiva colec- 
ción de objetos; y cada predicado poliádico, la relación que subsiste entre 
los componentes de un elemento de la respectiva colección de n-tuplos de 
objetos. Por último, la interpretación asigna a cada fórmula del CP1+ uno de 
los valores 0 ó 1, que la última estipulación semántica asocia respectivamente 
a la verdad o falsedad de esa fórmula. De este modo, nuestras reglas 
semánticas caracterizan a las fórmulas del CP17 como oraciones declarativas. 
Analicemos un ejemplo. Sean a una constante, P* un predicado monádico 
y P** un predicado diádico del CP17. ¿En qué condiciones precisas es verda- 
dera en (%,f) la fórmula Vx(P*x —> P**xa)? De acuerdo con la regla [1,], 
Vx(P*x > P**xa) es verdadera si y sólo si (P*x > P**xa) es verdadera en 
toda interpretación (Y,f') tal que f' sea una x-variante de (%,f). Según la 
regla [1], (P*x —> P**xa) es verdadera en (W,f'”) a menos que xe f'(P*) 
y (xa) £ Ff(P**). Por lo tanto, para que la fórmula Vx(P*x > P**xa) sea 
verdadera en la interpretación (9,f) es necesario y suficiente que cualquier 
objeto del dominio Y que tenga la propiedad designada en esa interpreta- 
ción por P* tenga con el objeto llamado a la relación designada por P**, 
He elegido para el CP1 un alfabeto paupérrimo, lo cual permite reducir la 
gramática a unas pocas reglas muy simples, pero dificulta la lectura. Para 
hacerla más fácil empleamos abreviaturas. Así, en vez de la fila de r palotes 
que individualizan un cierto término o predicado, escribimos el subíndice 
numérico r (xs en vez de x;¡¡¡¡, etc.); en vez de la fila de n asteriscos que 
indican la n-adicidad de un predicado, escribimos el exponente numérico n 
(P*, en vez de P****, |). Para mayor brevedad, podemos omitir los expo- 
nentes, ya que en una fórmula bien escrita la n-adicidad del predicado está 
indicada por el número de términos que lo acompañan. Asímismo, en con- 
textos en que se usan pocas variables, constantes o predicados diferentes, 
escribimos x, y, Z, U, V, W eN Vez de Xp, X¡, X7, Xz» Xy X5; A, b, c, d en vez de 
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Ay» A¡, A), Az; y cualquier mayúscula cursiva, sin subíndice ni exponente, en 
vez de P seguida de astericos y palotes. 

Otras abreviaturas, combinadas con las reglas semánticas antedichas, englo- 
ban ciertas ideas lógicas corrientes. Por ejemplo, es claro que la fórmula 
=Vx=P**xa es verdadera en la interpretación (%,f) si y sólo si hay por lo 
menos un objeto en % que tiene con el objeto llamado a la relación desig- 
nada por P**, Como esta condición es fácilmente comprensible por sí mis- 
ma, se adopta la fila “38? como abreviatura para representar a la fila VE”, 
que forman el signo de negación —, seguido por el signo de cuantificación 
universal Y, seguido por una variable €, seguida por el signo de negación —. 
Se estipula asímismo que, si a y B son fórmulas, la fórmula (a > B) se 
abrevia (a. v f), la fórmula —(a —> —B) se abrevia (a a B) y la fórmula 
=((a > P) > —(a > B)) se abrevia (a <> f). Si el lector no está familia- 
rizado con el tema, debe armarse ahora de papel y lápiz y verificar que las 
reglas semánticas del CP1 implican que: 


[1] Sia es la fórmula (B v y), fla) =0 si F(B) =0 0 f(y) = 0, y fía) 
= 1 sólo si KB) = FM) = 1. 

[L,] Si a es la fórmula (B A y), fla) = 1 si F(B)= 1 0 F(y) = 1, y fía) 
=0 sólo si (PB) = F(y) = 0. 

[L] Si a es la fórmula (PB > y), fla) =0 si y sólo si F(B) = F(y), y Fla) 
= 1 si y sólo si F(B) + f(y). 

[6] Si a es la fórmula 3€B, f(a) = O si hay alguna f', E-variante de 
(%,f), tal que F£'(B) = 0; y f(a) = 1 sólo si para toda f' que sea una 
E-variante de (D,f), FB) = 1. 


Los ideogramas v, n, <>, son los signos (conectivos) de disyunción, conjun- 


ción y equivalencia, respectivamente; 3 es el signo de cuantificación exis- 


tencial (3 seguido de una variable es un cuantificador existencial). 
Minimizar los ideogramas facilita el estudio de las propiedades generales 
de un cálculo, pues reduce el número de casos alternativos que hay que 
considerar para demostrarlas. Pero para el uso de un cálculo predicativo es 
más cómodo incluir también en su alfabeto “oficial” los cuatro ideogramas 
A, Y, OS y 3. Para ello hay que introducir reglas sintácticas [F_], [F,], [E] 
y [F5] que legitimen las fórmulas (a v B), (a A B), (a > PB) y Jéa, y agre- 
gar las reglas semánticas [1], [1], [L_] y [f3] a las estipulaciones que defi- 
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nen la aplicación f. Tal es la convención que seguimos en el resto de este 
apéndice y, en general, en este libro. Bajo dicha convención, por ejemplo, la 
expresión (a. v B) no es ya una mera abreviatura de la fórmula (a > P) 
sino, al igual que ésta, una fórmula genuina del cálculo. Por otra parte, es 
claro que (a v B) y (a > B) son lógicamente equivalentes. El lector para 
quien esto no sea obvio debe ejercitarse en probarlo; debe probar también la 
equivalencia lógica de (a a PB) con —(a > —B), de (a <> B) con —((a > B) 
> (a > B)) y de J¿a con "Vé¿—0.. 

Ocasionalmente es útil emplear la negrita para abreviar una fila de símbo- 


los consecutivos de la misma clase. Por ejemplo, en vez de x,x>Xx3X,X5 escri- 
bimos simplemente x o, si deseamos mayor precisión, x?. Asímismo 3x* y 
Vx? representan, respectivamente, una fila de 4 cuantificadores existenciales 
y una de 6 cuantificadores universales. 


E. CÁLCULO PREDICATIVO CON IDENTIDAD 


Una escritura conceptual sirve para expresar las matemáticas sólo si en ella 
se puede decir, llegado el caso, que tal objeto es el (único) valor de una 
cierta función para un dado argumento; por ejemplo, que 12 es la suma de 7 
y 5. En el CPl esto es posible si reservamos un predicado diádico para re- 
presentar la relación de identidad, representamos mediante predicados (n+1)- 
ádicos las funciones —o, más generalmente, las aplicaciones— cuyos argu- 
mentos son n-tuplos, y acompañamos cada uso de estos predicados de una o 
más aseveraciones que los caractericen como tales. Pero este procedimiento 
no es cómodo. Así, por ejemplo, si abreviamos con / el predicado diádico 
con que representaremos la identidad, tenemos que postular, para cada fór- 
mula o, la aseveración VxWyUxy > (a <> Q,,)). Si F es un predicado triádico 
elegido para representar una aplicación cuyo dominio es un conjunto de pares, 
hay que incluir la condición VxVWyVz(EFxyz > Vw(Fxyw —> Izw)). Más prác- 
tico y, en cierto modo, más natural, es agregar al alfabeto del CP1 un ideo- 
grama que signifique la identidad y un método para construir términos que 


x/y 


denoten el valor de aplicaciones en cada argumento dado y postular nuevas 
reglas sintácticas y semánticas que gobiernen el uso de estos signos. Llama- 
ré cálculo predicativo con identidad o CPl= a la escritura conceptual así 
ampliada. He aquí la gramática del CP1=: 
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El alfabeto. El alfabeto del CP1= consta de los doce ideogramas —=, >, A, 
Y, O, V,3, =,( ), ¡, *, y de las cuatro letras x, a, f, P. El ideograma = es 
el signo de identidad. 


Vocabulario. 


(1)  Functores: Distinguimos, para cada entero positivo n > 1, la clase de 
los functores n-arios. ff —la letra f seguida de un asterisco— es un 
functor 1-ario. Si p es un functor n-ario (n > 1), q, es un functor n- 
ario. Si p es un functor n-ario que no contiene palotes, q* es un functor 
(n+1)-ario. 

(11) Términos: Las variables y constantes del CP1= se definen como las 
del CP1. Además, cualquier functor n-ario seguido de n términos es un 
término. 

(11) Predicados: Se definen como en el CPl. 


Léxicos. Un conjunto (vacío, finito o infinito) de constantes, predicados n- 
ádicos y functores m-ádicos (para uno o más valores positivos de n y m) 
constituye el léxico de una versión del CP1=. 


Fórmulas. A las reglas de formación de fórmulas propias del CP1 hay que 
agregar la siguiente: Si t y G son términos, la fila de signos descrita a conti- 
nuación es una fórmula simple: 


[F_] (t = 0) 


Semántica. Sea CP1=Y una versión del cálculo predicativo de primer orden 
con identidad. Sea (%,f) una interpretación de CP1=f. Sea Y el conjunto 
de los functores, variables, constantes y predicados de CP1=+. Se mantie- 
nen todas las reglas semánticas que dimos para CP1+, excepto [I,] que se 
reemplaza por la regla [I',] enunciada abajo. Además, se agregan las reglas 
[Io] y [I_]. Las nuevas reglas determinan la interpretación de los términos 
precedidos por functores y de las fórmulas construidas según la regla [F_]. 


[L,] Para todo functor n-ario p e Y, f(p) es una aplicación cuyo domi- 
nio es el producto cartesiano de n partes de Y —no necesariamente 
distintas— no vacías y bien definidas, y cuyo codominio es una parte 


Apéndices 493 


bien definida de %. 

[L] Si t es una variable o una constante, f(t) e€ Y. Si t es un término 
formado por un functor n-ario p seguido de n términos O;,... 0, 
entonces (i) si (f(0,), ... ,f(G,)) pertenece al dominio de f(p), f(t) 
es el valor de la aplicación f(p) en el argumento (f(G5,), ... ,f(G,)); 
y (11) si (f(0,), ... .f(G,)) no pertenece al dominio de f(p), f(T) no 
está definida. 

[1_] Si a. es la fórmula (t = 0), fía) =0 si f(t) = fío) y fla) = 1 si 


ff). 


F. DECISIÓN Y DEDUCCIÓN 


El cálculo predicativo y otros sistemas similares de “lógica simbólica” se 
inventaron ante todo para poder juzgar si un razonamiento es correcto o in- 
correcto por la sola inspección visual de los signos que lo representan (cf. la 
cita de Leibniz en la p. 129). Evidentemente, este propósito se habrá logra- 
do con todos los razonamientos representables en el CP1= si se dispone de 
un algoritmo que permita calcular si una fórmula dada a es o no es válida. 
En efecto, si las premisas de un razonamiento se pueden representar con las 
fórmulas T,, T,,..., TT, y SU conclusión con la fórmula k, el razonamiento 
en cuestión será correcto si y sólo si la fórmula (T, ATA ...AT,) —>K 
es válida. (El lector para quien esto no sea enteramente obvio debe, como 
siempre, comprobarlo con papel y lápiz: muestre que, si la forma antedicha 
no es válida, puede ocurrir que la fórmula « sea falsa aunque todas las fór- 
mulas T¡, TT), ..., T, Sean verdaderas). 


23 El lector alerta advertirá que en el enunciado de la regla [I_] el signo “=" que figura 


entre T y O no es igual al signo “=" que figura tres veces después de la coma. El signo 
más largo es el signo de igualdad del CP1=; el signo más breve es el familiar signo 
de igualdad común al castellano y los demás idiomas modernos. Este distingo no se 
observa en la mayor parte de este libro, en que el signo corriente “=" se emplea como 
signo de igualdad en cualquier contexto, sea formal o informal. Con todo, uso el signo 
de igualdad largo cuando me refiero a la versión final de la escritura conceptual BS de 
Frege (Capitulo 2.2, Sección 2.3.3 y Apéndice XII), en la cual dicho signo representa 
a la vez la identidad entre objetos y la equivalencia entre oraciones (la cual presupone 
la identidad de sus valores veritativos). 
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Un algoritmo para determinar la validez de las fórmulas de un cálculo 
lógico (o de un fragmento de un cálculo lógico) se llama un procedimiento 
de decisión para ese cálculo (o fragmento). Para las fórmulas verifuncionales 
del CP1= hay un procedimiento de decisión —propuesto ya en 1880 por 
Peirce (CP, 3.387) y difundido en este siglo por Post (1921) y Wittgenstein 
(1922)— que consiste en la construcción de lo que se llaman “tablas de 
verdad”. Dicho procedimiento se funda en los hechos siguientes: (1) Cada 
una de las reglas semánticas [1_], [1,1, [LJ], [LJ y [L_] puede leerse como la 
definición de una operación sobre el conjunto (0,1) y permite calcular sim- 
plemente el valor asignado por esa operación a cada argumento admisible 
(que son dos en el caso de la operación 1-aria definida por [I_], cuatro en 
cada uno de los casos restantes).?* (11) Si a es una fórmula verifuncional con 
n componentes distintos AL,,..., 01, , cada interpretación f pertenece a una y 
sólo una de 2" clases de interpretaciones posibles, determinada por la lista 
de valores f(a;),... , F(a,). Computando 2” veces fía.) con arreglo a lo dicho 
bajo (i), se sabrá si a. es válida (esto es, si f(a) = O en todos los casos). 
Obviamente si a. es válida y es un prototipo verifuncional de una fórmula P, 
también f es válida. 

En los años 20, varios seguidores de Hilbert buscaron afanosamente un 
procedimiento de decisión para el CP1. Mas, como se explica en el Capítulo 
2.11, no puede haber tal procedimiento (al menos, si nos atenemos a la de- 
finición precisa de “algoritmo” propuesta por Church e insuperada hasta aho- 
ra). Hay, con todo, otro camino —más incierto, pero más viable— para ve- 
rificar si un razonamiento es correcto o no, por la sola inspección visual de 
su representación simbólica. Este camino, que ya fue seguido por Frege 
(Capítulo 2.2), consiste en organizar el cálculo lógico como un sistema de- 
ductivo, premunido de axiomas y reglas de inferencia. Un axioma es una 
fórmula distinguida del cálculo. El conjunto de los axiomas puede ser finito 


sá Simbolizando cada operación con el conectivo correspondiente, escribimos —0 = 1, —1 


=0:0>0=0,0>1=1,1>0=0,1> 1=0; etc. 

Supongamos que ol tiene la estructura (a, —> (a, —> 0,)). Para saber si a es o no 
válida hay que calcular f(a.) para los cuatro valores posibles del par (f(a¡),f(0L,)), a 
saber, (0,0), (0,1), (1,0) y (1,1). Reemplazando a, y a, en a por el valor correspon- 
diente y utilizando la “tabla de multiplicar para el operador >” presentada en la nota 
23, calculamos que f(a.) = O en todos los casos. Por lo tanto, cualquier fórmula de la 
estructura indicada es una tautología. 


25 
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O infinito, pero en todo caso tiene que haber un procedimiento que permita 
decidir, por la sola inspección visual de una fórmula, si ella es o no es un 
axioma. Por ejemplo, podemos estipular que cualquier fórmula obtenida re- 
emplazando a. por una fórmula del cálculo en la fila de signos (a v —a) es 
un axioma. Una regla de inferencia n—aria (n > 1) es una receta para asociar 
una fórmula llamada conclusión a un n-tuplo de fórmulas llamadas premisas, 
atendiendo exclusivamente al aspecto visual de éstas y aquélla. Esto quiere 
decir que cada regla n—aria R provee un algoritmo para decidir si una fór- 
mula dada es o no una conclusión, según 2, de un cierto n-tuplo de premisas. 
Por ejemplo, la regla de inferencia por modus ponens prescribe que, si aL y 
B son dos fórmulas cualesquiera, [$ se puede asociar como conclusión al par 
de premisas (a, (a > B));% y obviamente, basta deletrear un trío cualquiera 
de fórmulas para constatar si una de ellas es o no la conclusión por modus 
ponens de las otras dos. 

Una vez que el cálculo se ha organizado como sistema deductivo, se pue- 
de definir lo que llamaremos una deducción o prueba. Sea 4 un conjunto de 
fórmulas. Una lista finita de fórmulas 0.;,...., aL, constituye una prueba de 
la fórmula a., a partir de las hipótesis Y si, para cada k (1 < k< n), o bien 
a, e 4, o bien a, es un axioma, o bien hay una regla de inferencia r-aria (r 
< k) que asocia 01, como conclusión a un r-tuplo de premisas contenidas en 
la lista QL;,..., Ay. Si H = Y, decimos simplemente que 0L;,...., 0, es 
una prueba de 0.,. A la luz de esta definición es claro que, dada la índole de 
los axiomas y las reglas de inferencia, hay un algoritmo para decidir sí la 
lista A, ..., 01, constituye O no una prueba de al, a partir de determinadas 
hipótesis. Si hay una prueba de la fórmula a. a partir de las hipótesis 4 
decimos que, en el sistema deductivo adoptado, a. se deduce de $ o es de- 
ducible de XH; simbólicamente: Fa. Si los axiomas se eligen entre las fór- 
mulas de validez conocida, y las reglas de inferencia se diseñan de modo 
que la conclusión sea siempre una consecuencia lógica de las premisas, di- 
remos que el sistema deductivo es correcto. En tal caso, como es obvio, al 
se deduce de 4f sólo si a es una consecuencia lógica de % (Hra sólo si 


26 Recuérdese que según la convención adoptada “(a —> PB)” designa la fila de signos que 


forman el paréntesis izquierdo, seguido por la fila a, seguida por la flecha, seguida por 
la fila fP, seguida por el paréntesis derecho. 
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Kia). En particular, sólo si a es válida hay una prueba de a (sin hipóte- 
sis). 

Un sistema deductivo incorrecto sería, por cierto, inservible para el pro- 
pósito original del cálculo lógico. Pero un sistema correcto sólo acabará de 
satisfacernos si a la vez es completo, esto es, si toda fórmula a. que sea una 
consecuencia lógica de un conjunto de fórmulas Jf se deduce de %f en el 
sistema. Entonces, ba si y sólo si HéE a, y la relación puramente sintáctica 
de deducibilidad simula cabalmente la relación semántica de consecuencia 
lógica. Gódel (1930) demostró que el sistema deductivo ostensiblemente 
correcto para el CP1= que él toma de Russell y Whitehead es un sistema 
deductivo completo (Capítulo 2.8). 


G. UN SISTEMA DEDUCTIVO PARA 
EL CÁLCULO DE PRIMER ORDEN 


A modo de ejemplo, propongo a continuación un sistema deductivo para 
el CP1, basado en uno de los sistemas de “deducción natural” introducidos 
por Gentzen en su tesis doctoral, “Investigaciones sobre la deducción lógi- 
ca” (1934). Para mayor claridad, incluyo en el alfabeto —además de los sig- 
nos indicados en la sección A— los conectivos n y v y el signo de cuantifi- 
cación 3 (el significado de estos signos se explicó en la sección D). La ca- 
racterística más notable de los cálculos de Gentzen es que los componentes 
de una deducción —premisas, conclusión, etapas intermedias— no represen- 


tan, por regla general, aseveraciones incondicionales, sino aseveraciones con- 
dicionadas por ciertos supuestos o hipótesis, tal como ocurre en la vida real 
y especialmente en el razonamiento matemático.?” Por eso, tales componen- 
tes no son fórmulas, sino filas de fórmulas estructuradas en cierta forma. 
Para indicar esa estructura, agregamos al CP1 dos signos de puntuación: la 
coma [,] y la flecha secuencial [>-]. Un secuente es una fila de fórmulas del 


27 Como bien observa Gentzen, “una prueba matemática no está, en general, construida 


de un modo tan simple, que en ella se avance, mediante inferencias, de aseveraciones 
válidas a nuevas aseveraciones válidas. Ocurre también que una aseveración se supone 
válida y de ella se infieren nuevas aseveraciones cuya validez depende entonces de la 
validez de esa suposición” (1935, p. 511). 
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CP1 separadas por comas, seguida del signo >, seguida de una fórmula del 
CP1.2% Las fórmulas que preceden al signo > son las prefórmulas del 
secuente; la fórmula precedida por el signo >- es la posfórmula. La semán- 
tica de los secuentes es muy simple. Consideremos una determinada versión 
del CP1. Sea q una fórmula de esa versión y I” una fila de fórmulas separa- 
das por comas. El secuente IT” >- y es válido si y sólo si p es verdadero en 
cada interpretación (de la versión considerada) en que ninguna de las fórmu- 
las de I' sea falsa. En virtud de esto, las prefórmulas de un secuente válido 
representan hipótesis cuya verdad en una interpretación dada asegura la ver- 
dad —en esa misma interpretación— de la aseveración representada por la 
posfórmula. 

Llamo secuente básico a cualquier secuente de la forma p >- (q, donde q 
es una fórmula cualquiera. Cada secuente básico es válido de un modo tri- 
vial y puede usarse como axioma en las deducciones. No se admiten otros 
axiomas lógicos. El poder deductivo del sistema radica, pues, enteramente 
en sus reglas de inferencia. Cada regla de inferencia determina una relación 
entre una, dos o tres premisas y una conclusión. Llamo inferencia al conjun- 
to ordenado que forman premisa(s) y conclusión. Distinguimos (1) reglas 
estructurales (que llevan de una premisa con cierta estructura secuencial a 
una conclusión de estructura diferente), (11) reglas de eliminación e intro- 
ducción de los conectivos binarios y los signos de cuantificación y (111) dos 
reglas peculiares a la negación. En la siguiente formulación esquemática de 
las reglas de inferencia, las letras griegas mayúsculas I' y A representan filas 
—posiblemente vacías — de fórmulas separadas por comas, las minúsculas 
P, Y. Y representan fórmulas, la minúscula 1 representa un término, las mi- 
núsculas € y n representan variables, y los signos lógicos y de puntuación 
están, como de costumbre, representados por ellos mismos. Cada regla se 
presenta mediante una figura con una raya horizontal en el centro; el esque- 
ma de la o las premisas va sobre la raya, el esquema de la conclusión bajo 
la raya. Las inferencias por eliminación de » e introducción de v tienen dos 
figuras cada una. 


si Gentzen dice “Sequenz”, que es la forma alemana de la misma palabra latina que en 


nuestro idioma se ha convertido en “secuencia”. Pero lo que nosotros llamamos *se- 
cuencia” se llama “Folge” en alemán. Por eso digo “secuente” por “Sequenz”, siguiendo 
el ejemplo de los escritores de habla inglesa, que dicen “sequent” (no “sequence”). 
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Reglas estructurales: 
DEBILITAMIENTO CONTRACCIÓN PERMUTACIÓN 
al A D, 9, y, A > x 
pI>x op I>x P, y, 9, A > y 
Reglas de introducción y eliminación: 
INTRODUCCIÓN ELIMINACIÓN 
UN T>oe T>wy T>=opAY T>=opoAVy 
T>—opAY T>o0Q T>wy 
v I>Q T>wy To vyY QA>Y WA>x 
T>—Oovy T>—ovy 15 
Ed 9 1> y r>e A> (9 > y) 
+ (py) I, A + 
V += e T > V¿ep 
T > V¿ep DT > Oo 
siempre que n no figure en ' ni en V¿Qp donde t es un término cualquiera 
3 > O. T > 380 On» A+ y 
T > 360 DA>wy 


donde t es un término cualquiera 


Reglas de la negación: 
REFUTACIÓN 
p1I>ywy 0 A> —y 


T, A > —Q 


siempre que y no figure en IT, A, y ni 3£p 


ELIMINACIÓN DE == 
r > 0 
T>wy 
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Con un poco de reflexión el lector podrá comprobar que, si las premisas 
de cada una de las inferencias arriba representadas son secuentes válidos, la 
conclusión respectiva también es un secuente válido. Si no conocía el tema 
de antemano, debe poner especial empeño en entender por qué la restricción 
impuesta a la variable n en las reglas de introducción de Y y de eliminación 
de 3 (se exige que n sea una variable “nueva”) es a la vez necesaria y su- 
ficiente para que las inferencias gobernadas por esas reglas sean correctas. 
Una prueba (Gentzen dice Herleitung, *derivación”) es una lista finita de 
secuentes cada uno de los cuales es un secuente básico o es la conclusión de 
una inferencia (conforme a alguna de las reglas indicadas) cuya(s) premisa(s) 
lo precede(n) en la lista. En otras palabras, si A = (Sp, ...,S,) es una lista 
finita de secuentes (n > 0), A es una prueba si y sólo si, para cada índice k 
(0 < k < n), tenemos que $, es un secuente básico o la conclusión de una 
inferencia con premisas Sy, Si, S¡ (0<h<1i< j<k). 

Ilustraré estas ideas con un ejemplo modesto, una prueba de la conocida 
tautología (P > (P, > P)). La prueba va en la columna del centro; los nú- 
meros de la izquierda sirven para identificar a los secuentes; la columna de 
la derecha indica la regla en que se basa la introducción del secuente res- 
pectivo, así como el número de identidad de la premisa correspondiente. SB 
significa “secuente básico”. 


(1) P>P SB 
Q) Eje PB Debilit., (1) 
(3) P=>(P, >P) Int. >, Q) 
(4) > (P > (P, > P)) Int. >, 3) 


El secuente (1) es válido. La prueba se ajusta a las reglas. Por lo tanto, el 
secuente (4) es válido. Su posfórmula es, por ende, verdadera en cualquier 
interpretación del cálculo en que no sea falsa una de sus prefórmulas. Como 
el secuente (4) no tiene prefórmulas, no hay ninguna interpretación en que 
una de ellas sea falsa. Por lo tanto, la posfórmula (P > (P, > P)) es válida 
(verdadera en cualquier interpretación). 
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H. CÁLCULO PREDICATIVO DE SEGUNDO ORDEN 


Como se dijo, un cálculo predicativo de segundo orden debe permitirnos ex- 
presar generalizaciones acerca de propiedades y relaciones de los objetos 
individuales a que se refiere nuestro discurso. Ello demanda muy pocas in- 
novaciones sintácticas. 


Alfabeto. Además de los ocho ideogramas y cuatro letras del CP1=, inclui- 
mos las letras X y F. 


Variables. Distinguimos tres clases de variables: variables individuales, for- 
madas como en el CP1= por la letra x seguida o no de palotes; variables 
funcionales y variables predicativas. Los nuevos tipos de variables se carac- 
terizan así: Una variable predicativa n-ádica consiste de la letra X, seguida 
de n asteriscos (n > 1), seguidos por O o más palotes. Una variable funcional 
r-aria consiste de la letra F' seguida de r asteriscos (r > 1), seguidos por O o 
más palotes. 

Esta innovación justifica los siguientes cambios en nuestra terminología: 
Llamamos constantes a las antiguas constantes, así como a los antiguos 
predicados y functores. Las constantes que empiezan con la letra a son cons- 
tantes individuales, las que empiezan con la letra fson constantes funciona- 
les y las que empiezan con la letra P son constantes predicativas. Llamamos 
signos individuales a las variables y constantes individuales, functores a las 
variables y constantes funcionales y predicados a las variables y constantes 
predicativas. 


Functores. Conforme a la estipulación anterior, la segunda cláusula de la regla 
(1) concerniente al vocabulario del CP1= debe reemplazarse por ésta: “f* y 
F* son functores 1-arios”. El resto queda igual. 


Términos. Se mantiene lo dicho arriba, entendiéndose ahora que las varia- 
bles y constantes aludidas bajo este título en la sintaxis del CP1 son varia- 
bles y constantes individuales, y que en el párrafo homónimo de la sintaxis 
del CP1=, “functor” significa “variable o constante funcional”. 


Predicados. Para que todas las variables predicativas queden comprendidas 
en esta categoría basta insertar esta cláusula en la regla pertinente del CP1: 
“La letra X es un predicado 0-ádico”. 


Fórmulas. En las reglas [F,] y [F5] se entiende ahora que € designa una 
variable de cualquier clase, individual, funcional o predicativa. 
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Llamaré CP2= a la familia de cálculos de segundo orden con identidad 
gobernado por estas reglas de sintaxis (además a las ya formuladas para el 
CP1 y el CP1=). Una versión del CP2= incluye todas las variables de las 
tres clases, y un cierto subconjunto —posiblemente finito o incluso vacío— 
de las constantes, los functores y los predicados. 

La semántica de los cálculos de segundo orden no se deja precisar con 
tanta facilidad como la sintaxis. Además de la llamada semántica estándar, 
descrita enseguida, se han propuesto otras muy diferentes (Henkin 1950). 

Una interpretación estándar del CP2= se obtiene extendiendo a las nue- 
vas variables (funcionales y predicativas) la función f característica de una 
interpretación del CP1=. Específicamente, una interpretación (%,f) asigna 
un objeto del dominio no vacío Y a cada signo individual, un conjunto de 
n-tuplos de objetos de % a cada predicado n-ádico (constante o variable) y 
una aplicación de 9" en Y a cada functor n-ario (constante o variable). Las 
reglas de semántica del CP1= se pueden mantener inalteradas, con tal que 
las palabras “functor”, “término”, “predicado” y “variable” se entiendan en sus 
nuevas acepciones. 


Il. ALCANCES 


En la Sección B definí el alcance de un cuantificador. Este concepto de 
alcance puede extenderse también a los conectivos, predicados y functores. 
En las definiciones siguientes me refiero en cada caso a una ocasión en que 
el objeto de que se habla figura en una fórmula dada. El alcance de un pre- 
dicado n-ádico (o de un functor n-ario) es la fila de n términos precedida 
inmediatamente por él. El alcance de un cuantificador o de un signo de ne- 
gación es la subfórmula que comienza inmediatamente a su derecha. El al- 
cance de un conectivo que no sea el signo de negación son las dos subfór- 
mulas que lo flanquean. El lector que tenga dudas sobre estas definiciones 
debe hacer ejercicios. Diga, por ejemplo, cuáles son, respectivamente, los 
alcances de Vx,, 3x,, =, V, P?, P? y f? en la fórmula 


—Vx (PPx,x7x, v JxP?xoPx,x3).2 


29 Solución en la p. 540. 
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J. OMISIÓN DE PARÉNTESIS 


Para alivianar la lectura, en general no se imprimen todos los paréntesis que, 
según la sintaxis, pertenecen a una fórmula dada. Desde luego, se omite el 
primer y el último paréntesis de una fórmula cuando son, respectivamente, 
su primer y su último símbolo: en vez de (a > B), escribimos —a > P. 
Estipulamos un orden de prioridad de las asociaciones que los conectivos 
establecen entre las expresiones inmediatamente adyacentes. La conjunción 
A y la disyunción v asocian las fórmulas adyacentes más estrechamente que 
la flecha > y la doble flecha <>. Según esto, a an KB > B v y es la fórmula 
((a a B) > (B v y). Si una fórmula figura entre dos flechas, la asociación 
determinada por la flecha a su derecha tiene prioridad sobre la asociación 
determinada por la flecha a su izquierda. Así, a > > y > O es la fórmula 
(a > (B > (y > 8))). Por último, es corriente omitir los paréntesis que, 
según la regla [F_], rodean a las expresiones unidas por el signo de identi- 
dad =. No hay riesgo de confusión, porque, a diferencia de los conectivos 
A, Y, > y >, la identidad se intercala entre términos, no entre fórmulas. 
Por lo tanto, si o y t son términos y a. y $ son fórmulas, en vez de ((c = 
1) > (a > B)), podemos escribir sin ambigiiedad do =1T —>a > Pp. La 
convención relativa al signo = también nos permite omitir los paréntesis en 
=(o = 1) y escribir =o = t; pero lo corriente en este caso es usar el signo 
+ y escribir simplemente o 4 t. 


X 


AXIOMAS DE LA LÓGICA 
(FREGE 1879) 


Las nueve fórmulas de la escritura conceptual BS reproducidas a continua- 
ción son las leyes lógicas que Frege (1879) adopta como premisas inde- 
mostradas de sus deducciones. Están numeradas como en el libro de Frege. 
El lector hará bien en verificar que equivalen, respectivamente, a las nueve 
fórmulas del CP1 señaladas con los mismos números hacia el final del Ca- 
pítulo 2.2. También debe verificar que esas nueve fórmulas son verdades 
lógicas conforme a las reglas semánticas del CP1 (Apéndice IX). 
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XI 


DEFINICIONES RECURSIVAS (DEDEKIND 1888) 


En el Capítulo 2.3 expliqué lo que Dedekind llama un sistema simplemente 
infinito ordenado por una aplicación. En el presente apéndice, una expre- 
sión de la forma (4,p,a) designa un sistema simplemente infinito s4, orde- 
nado por la aplicación y y con elemento básico a. Sim,ne A y m>n (m 
es mayor que n) en el sentido definido en la p. 158, digo también que n < 
m (n es menor que m). Digo, asímismo, que m es el primer elemento de 4 
que satisface una condición dada sim e í y satisface dicha condición, pero 
ésta no es satisfecha por ningún n e 4 que sea menor que m. Si x y y son 
dos aplicaciones, escribo yy para referirme a la aplicación compuesta y o 
ye 

Dedekind fue quizás el primero en entender que sólo es legítimo dar defini- 
ciones recursivas o “por inducción” si se ha demostrado que tales definicio- 
nes caracterizan en forma inequívoca aquello que se pretende definir con ellas. 
Su Teorema de la Definición por Inducción (TDI) responde justamente a esta 
necesidad. En el Apéndice VIII lo enuncié de un modo apropiado al contex- 
to. El enunciado siguiente se ajusta mejor al texto de Dedekind: 


TDI Sea Q un sistema cualquiera. Sea (N,o,1) un sistema simplemente 
infinito. Si 6 es una aplicación de Q en (2 y ( es un elemento de- 
terminado de (2, hay una y sólo una aplicación y: N —= Q que satis- 
face las condiciones siguientes: 

L y(1)=0 
IL Para todo ne N, yo(n) = Ovy(n). 


La demostración del TDI se basa en el siguiente lema: 


A Sea Q un sistema cualquiera y n un elemento del sistema simple- 
mente infinito (N 0,1). Sea Z,, al sistema formado por todos los ele- 
mentos de N iguales o menores que n. Si O es una aplicación de Q 
en Q y O es un elemento determinado de Q, hay una y sólo una 
aplicación y: Zp —> Q que satisface las condiciones siguientes: 
(a) Yn(1) =0 
(Pp) Para todo £ < n, w,o(t) = Oy,(1). 
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El lema A se demuestra por inducción. Evidentemente, hay una y sólo una 
aplicación yy de Z4 = (1) en Q tal que w4(1) = 0; yy satisface trivialmente 
la condición ($) para n = 1, pues no hay un número f < 1. Por lo tanto, A 
vale para n = 1. Supongamos ahora que A vale para n = q. Demostraré que 
en tal caso también vale para n = c(q). Por hipótesis, existe una única apli- 
cación Yy: Z¿ > Q que cumple las condiciones (a) y (B). Hay, por lo tan- 
to, en (2 un único objeto v = Oyy(q). Por consiguiente, la aplicación yo(g): 
Zo(q) > Q, definida por x > yy) (si x e Z¿) y 0(q) > vu, existe y satis- 
face las condiciones (a) y (B), y es claramente la única aplicación de Z:(g) 
en (2 que las satisface. Por lo tanto, A vale para cualquier número n. 

Una vez asegurado el lema A, la demostración del TDI es fácil. Tenemos 
que para cada ne N hay una única y: Z, —> Q que cumple las condiciones 
del lema. Por lo tanto, la aplicación yw: N —= Q, definida por w(n) = y,(n) 
para cada ne N, existe y cumple las condiciones I y II del TDI.*% Supon- 
gamos ahora que q: N => Q también cumple ambas condiciones pero y + y. 
Sea u el primer elemento de N tal que w(u) + x(1). Como y y y cumplen 
la condición 1, es claro que u > 1. Hay, pues, un número v tal que u = o(v) 
y w(v) = y(v). Como x y y cumplen la condición Il, w(u) = wo(v) = Oy(v) 
= 0y(v) = xo(v) = = y(1), contradiciendo la hipótesis de que w(u) + x(11). 
Por lo tanto, no hay una x: N = O, diferente de y, que cumpla las condi- 
ciones del TDI.*! 

Mediante el TDI Dedekind puede demostrar que todos los sistemas simple- 
mente infinitos son isomórficos. Sean (N,o,1) y (M(,1,0) dos sistemas sim- 
plemente infinitos. Se trata de probar que hay un isomorfismo entre ellos, 
esto es, una biyección yw: N = Ml, con inversa y”!, tal que w(1) = 0, ty = 
wo y tyw”!=wy"l0. Según el TDI hay una y sólo una aplicación yw: N —= Ml 
tal que y(1) = 0 y ty = wo. Probaremos que y es biyectiva. Supongamos, 
por el contrario, que y no es ni siquiera inyectiva. Si hay un ne N tal que 


70 Obsérvese que Dedekind usa aquí ya en 1888 el método de diagonalización que Can- 


tor hará famoso con su segunda —y más conocida— prueba de la indenumerabilidad 
del continuo de 1890/91. Por lo demás, ese método había sido empleado antes por du 
Bois- Reymond (1875); vide supra p. 43, nota 11. 


dde Como Ya(n) concuerda con y, en Z,,, para cada n e Ni, resulta que y, es precisamente 


la restricción de y a Z;. 
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nz1 y yn) =0, hay un me N tal que n = o(m) y 0 = yo(m) = ty(m) € 
T(M'), lo cual es imposible. Sea pues m > 1 el primer elemento de N tal que 
w(n) = y(n) para un ne N tal que n + m. Sea h = om) y k = on). 
Como k * h < m, vw(h) + w(k) por hipótesis. Como t es inyectiva, tyw(h) + 
Twy(k). Pero ty(h) = wo(h) = wo(k) = ty(k). ¡Contradicción! Por lo tanto, w 
es inyectiva. Supongamos ahora que y, aunque inyectiva, no es biyectiva. 
Entonces hay elementos de Jl que no pertenecen a w(N). Sea a el primer 
elemento de Ml tal que a ¿ w(N). Como O = wy(1), a % O. Por lo tanto, hay 
un be Mí tal que a = 1(b) y hay un ce N tal que b = w(c). Pero entonces 
a = ty(c) = yo(c), de modo que a e yw(N). ¡Contradicción! Por lo tanto, y 
es biyectiva. Sea, pues, w”!: MU —= N la biyección inversa. Tenemos que 
y7(0) = 1. Además, yt = ywdyy") = y Gywy” = y yowy” = 
(y yw)owy”! = owy”!. Esto completa la demostración de que y es un isomor- 
fismo. Se observará que y”! es precisamente la aplicación de Jl en N cuya 
existencia y unicidad establece el TDI. 

La unicidad de y y y”! significa que cada elemento de .(l puede tomarse 
como representante canónico de un determinado elemento de N y viceversa. 
Por esta razón, se justifica plenamente sostener con Dedekind que cada sis- 
tema simplemente infinito puede servirnos de “serie numérica” lo mismo que 
cualquier otro (cf. Capítulo 2.3). En lo que resta de este apéndice, hablaré 
sólo de una tal estructura fija (N,o,0), que elijo como representativa.%? Si- 
guiendo a Dedekind, definiré la adición, la multiplicación y la exponenciación 
en esta estructura y demostraré que la adición y la multiplicación así defini- 
das tienen las propiedades tradicionales: conmutatividad, asociatividad, distri- 
butividad de la multiplicación con respecto a la adición. Las demostraciones 
se hacen por inducción. Para facilitar la lectura sigo en todas el mismo es- 
quema: enuncio una tesis [T] concerniente a un número indeterminado n; 
establezco la base de la inducción [B]: la tesis es verdadera si n = 0; y doy 
el llamado “paso inductivo” [P], esto es, pruebo que si la tesis vale para un 
dado n e N también vale para el elemento siguiente c(n). 


sd Conforme a la práctica matemática actual, designo con O el elemento básico de la “se- 


rie numérica” representativa (contamos: “cero, uno, dos, ... ”). Como se verá, ello per- 
mite definir elegantemente la adición de modo que la operación de sumar el elemento 
básico (x => x + 0) coincida con la identidad Py: N > N;x = x+1. 
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Adición. En virtud del TDI existe, para cada n e Ni, una y sólo una aplica- 
ción o,: N = Ni, tal que 0,(0) = n y 0,0 = 00,,. En particular, oy es la 
identidad en N, 4: x > x, pues ésta es la única aplicación de N — N que 
conmuta con a y asigna el valor O al argumento 0. La adición queda enton- 
ces definida inequívocamente por la condición: n + m = 0, (n). Probaremos 
por inducción que, para todo m, ne Ni, o(n + m) = n + o(m). 


FT] 00,,(11) = O: (11). 

[B] Es claro que O, (0) = o(m) = 00, (0). 

[P] Si o(n + m) = 00, (1) = Sy (1) = n + 5(m), entonces c(c(n) + m) 
= 00, 0(1) = 000, (1) = 909) (11) = Gamy0(0) = (5(n) + o(m)). 

Por lo tanto, o(n + m) = n + o(m), para todo n, cualquiera que sea m. Si 
ponemos m = 0, comprobamos que G¿(p, = 90y = O. 


La adición es asociativa. 


[T] Si a, b y n son cualesquiera elementos de N, entonces 

(a+ b)+n=az+(b+mnm). 

[B] (a+ b)+0=a+b=a+(b+0) 

[P] Si (a + b) + n= a +(b + n), entonces (a + b) + o(n) = 

o((a + b)+n)=6(a + (b + n)) = a + o(b + n) = a + (b + c(n)). 
Por lo tanto, la adición es asociativa. 


La adición es conmutativa. 
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[T] Si a y n son cualesquiera elementos de N, a+n=n + a. 
[B] a+ 0 = opa) =a=0,(0) = 0 + a. 

[P] Si a + n =nm + a, esto es, si 0,0,(0) = 0,0,(0), tenemos que 
a + o(n) = 00,0,(0) = 50,5, (0) = 05,50, (0) = o(n) + a. 

Por lo tanto, la adición es conmutativa.? 


Como Dedekind cuenta “uno, dos, tres, ... ”, tiene que definir la adición de modo que 
el elemento básico sumado a cualquier n no dé n sino el siguiente de n. Sea pues el 
sistema simplemente infinito N ordenado por la aplicación o la serie numérica repre- 
sentativa elegida por Dedekind, y designemos con 1 su elemento básico. Dedekind 
considera para cada n e N la única aplicación ,: N = N, tal que p,(1) = o(n) y q,0 
= 0. Obviamente, pq = O. La adición se define por la condición m + n = q, (m), la 
cual implica que (i) m + 1 = o(m) y (1) o(m + n) = m + o(n). La conmutatividad y 
asociatividad de la adición pueden establecerse entonces como arriba. 
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Multiplicación. Para definir la multiplicación, conviene tener presente que, 
en virtud del TDI, si ne N hay una y una sola aplicación y,: N —> N tal 
que x, (0) = 0 y 0,x, = X,9. Obsérvese, en particular que, para todo ne Ni, 
Zo) =0 y Za 0) = n.* La multiplicación queda inequívocamente defini- 
da por la condición mx n = y, (mm). En virtud de la observación recién he- 
cha, nx0=0=0xnmynx 0(0) = n. 


La multiplicación es distributiva. 


[T] nx (a+ b)= (nx a) + (nx b). 

[B] 0x (a+ b)=0=(0x a) + (0x Db). 

[P] Sinx (a+ b)= (nx a) + (nx b), o(n) x (a + b) = y,,¿0(n) = 
Samka (A) = (Ax [la + b)+a+b=(nx a) + (nx b)+a+b= 

(nx a) +a+(nx b)+b=, 0,1) + 5,1) = SM) + x,0(N) = 
(o(mx a) Ho(n)x b). 

Por lo tanto, la multiplicación es distributiva (con respecto a la adición). 


La multiplicación es conmutativa. 


[T] nx a=ax n. 

[B]0xa=0=ax 0. 

[P] Sinx a= ax n, o(n)x a = q¿o(n) = 0, ¿(n) = (nx a) + a = 
(ax n) + (ax o6(0)) = ax (n + 6(0)) = ax o(n). 

Por lo tanto, la multiplicación es conmutativa. 


La multiplicación es asociativa. 
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[T] nx (ax b) = (nx a)x b. 

[B] 0x (ax b)= 0O=(0x a)x b 

[P] Sinx (ax b)= (nx a)x b,onx (ax D) = 0) = Sora) = 
(nx (ax by) + (ax b)= ((nx a)x b) + [ax b)= (bx (nx a) + (bx 
a =bx(nxa)j+a)=bx ((ax n) + (ax o(0)) = 

bx (ax (n+65(0)) =bx (ax o(m)) = ((o(n)x a)x b. 

Por lo tanto, la multiplicación es asociativa. 


Por una parte, xpgo(n) = SoLo) = xo) + O = xo(m) = 0, puesto que xo(0) = O. Por 
otra parte, Zoo (5(0)) = o(0) y si Xa0/(1) = n, entonces Xo00(1) = Soo (1) = 
550%00)1) = 5%: 01M) = o(n). 
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Exponenciación. Para definir la exponenciación, consideramos que, en vir- 
tud del TDI, si ne N hay una y sólo una aplicación e,: N — N tal que 
£,(0) = 0(0) y y,€, = 8,0. Definimos: m"= e,(m). El lector puede ejercitarse 
en probar que mó = 0(0), mim? = mP*9 y (mP)1 = m'2, cualesquiera que sean 
m, p, q € N. 


XII 


EXTENSIÓN Y RECORRIDO 
(FREGE 1891, 1893) 


Según Frege (1884), cada número natural es la extensión de un concepto, a 
saber, el concepto mediante el cual se piensa la propiedad de ser equinumeroso 
con cierto concepto (éste puede ser cualquiera de los conceptos a que —en 
sentido fregeano— corresponde el número en cuestión). Para Frege, las ex- 
tensiones de conceptos son objetos, que pueden naturalmente caer bajo otros 
conceptos —por ejemplo, la extensión del concepto equinumeroso con el 
concepto “día de la semana' (esto es, el número 7) y la extensión del con- 
cepto equinumeroso con el concepto “mes del año” (esto es, el número 12) 
caen ambas bajo el concepto número finito. Como Frege (1884, p. 80n.) dice 
que da por sabido lo qué es la extensión (Umfang) de un concepto, en mi 
presentación de su filosofía de la aritmética en la Sección 2.3.3 asigné a ese 
término su significado tradicional, con arreglo al cual la extensión de un 
concepto es la suma o agregado de todas las cosas que caen bajo ese con- 
cepto. 

En su versión original, la escritura conceptual BS no incluía un medio 
específico para nombrar la extensión de un concepto. Frege (1891) remedia 
esta deficiencia introduciendo lo que luego describe como “uno de los 
enriquecimientos más fecundos (folgenreichsten) de mi escritura conceptual” 
(1893, p. 14). De ahí en adelante, la notación ¿F(e) designa la extensión — 
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en el sentido de Frege— del concepto expresado por la letra F.2% Con todo, 
las explicaciones que rodean la introducción del nuevo recurso expresivo 
parecen indicar que, en su obra madura, Frege no entiende el término *ex- 
tensión de un concepto” en la acepción tradicional arriba señalada. 

Como indiqué en el Capítulo 2.2, desde 1891 Frege entiende que los 
conceptos constituyen una especie del género función. Un concepto es una 
función que asigna a cada objeto del universo uno de los dos valores v (“lo 
verdadero”) o f (“lo falso”). Frege supone que cada función esta asociada a 
un objeto característico, que llamaré su recorrido (Frege dice Wertverlauf, 
literalmente, “recorrido del valor”). Frege no explica en qué consiste el re- 
corrido de una función. Se limita a decir que “emplea universalmente las 
palabras “la función D(8) tiene el mismo recorrido que la función Y(8)” como 
sinónimas de las palabras “las funciones D(8) y Y(8) tienen siempre valores 
iguales para argumentos iguales”” (1893, p. 7). La notación ¿D(e) se intro- 
duce precisamente para designar el recorrido de la función O (1891, p. 10). 

Frege adopta la siguiente convención léxica: “Podemos designar como 
extensión de un concepto (Begriffsumfang) al recorrido de una función cuyo 
valor para cada argumento es un valor veritativo (Wahrheitswert)”, esto es, 
uno de los objetos v o f (1891, p. 16). En virtud de ella, si la función D es 
un concepto, la expresión “¿D(e)” denota su extensión —en el nuevo sentido 
fregeano— mas no parece que ésta pueda identificarse con la colección de 
todas las cosas que caen bajo ese concepto. 

Las funciones fregeanas son, como sabemos, aplicaciones del universo de 
objetos en sí mismo. La equivalencia ¿D(e) = ¿P(e) O VxX(P() > Y) 
sugiere, pues, que el recorrido de la función Y es lo que hoy llamaríamos su 
grafo, esto es, el conjunto de todos los pares (x, D(x)) que se forman toman- 


a Hay una ironía involuntaria en el epíteto folgenreichste —literalmente, “más rico en 


consecuencias” — aplicado a la nueva notación pues gracias al axioma introducido por 
Frege para regular su uso resulta que todas las aseveraciones expresables en la escritu- 
ra BS son derivables en el sistema fregeano. 


sd La notación se extiende fácilmente a lo que Frege llama “funciones con dos (o más) 


argumentos”, tal como la suma, designada por la expresión insaturada € + € (en que las 
letras griegas marcan los “huecos”). Si fijamos uno de los dos argumentos, poniendo, 
digamos, € = 3, obtenemos una función de un argumento, cuyo recorrido es é(e + 3). 
Entonces, la expresión insaturada “¿(e + €)” designa una función de un argumento, cuyo 
recorrido es dié(e + 01). 
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do cada argumento x de la función OD junto con el valor correspondiente D(x). 
Los argumentos de una función fregeana son todos los objetos del universo. 
Si la función es un concepto, los valores admisibles son sólo los dos valores 
veritativos. Por lo tanto, el grafo de un concepto consta de dos clases de 
pares, aquellos cuyo segundo miembro es v y aquellos cuyo segundo miem- 
bro es f, y divide exhaustiva y exclusivamente los objetos del universo en 
dos grupos, aquellos que forman el primer miembro en un par de la primera 
clase y aquellos que forman el primer miembro de un par de la segunda cla- 
se. Si entendemos, pues, que el recorrido de una función fregeana es preci- 
samente su grafo, entonces la extensión fregeana ¿F(e) del concepto expre- 
sado por la letra F puede verse como una partición del universo —lo que 
propongo llamar una cortadura de Frege (Frege-Schnitt en alemán, Frege- 
cut en inglés) — en la que cada objeto x figura marcado con uno de los dos 
valores veritativos. Por otra parte, dos conceptos F y G tienen el mismo re- 
corrido si y sólo si los objetos que caen bajo F son precisamente los mismos 
que caen bajo G. (Como es obvio, si Dd y Y son conceptos, ¿D(e) = ¿P(e) 
O VAD(A) O YO) O VAD() = v O Y) = v).) 

Frege (1893) utiliza eficazmente la notación ¿F(e) para expresar en BS la 
definiciones de conceptos aritméticos fundamentales que había formulado en 
alemán en 1884. Las nuevas definiciones son sumamente ingeniosas y es una 
lástima que no pueda comentarlas aquí. La nueva notación figura sólo en 
dos de las “leyes lógicas fundamentales” en que descansa el sistema deduc- 
tivo de Frege. Aquí sólo nos interesa la primera:?” 


(v) (éfle) = ág(a)) = (Hu fl) = g(1D) 


si La otra ley fundamental en que figura la notación ¿O(e) es esta: 


(VD Ha =Né(a = £) 


Ella incorpora formalmente al sistema la notación W” que Frege 1893, p. 19, explica 
informalmente en estos términos: 


Distinguimos dos casos: 


1) Si, para el argumento [de la función W5] existe un objeto A tal que NE(A = £) 
sea el argumento, entonces A mismo es el valor de la función M. 

2) Si para el argumento [de la función 6] no existe ningún objeto A tal que WE(A 
= e) sea el argumento, entonces el argumento mismo es el valor de la función WM. 
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Ella repite formalmente y a título de axioma la indicación arriba citada acer- 
ca de las condiciones en que los recorridos de dos conceptos son iguales. 
Este Axioma V de Frege 1893 lleva derechamente a la paradoja de Russell. 
La siguiente derivación fue publicada por Frege (1903, Nachwort) poco des- 
pués de que Russell le escribió al respecto. Para facilitar la lectura, “traduz- 
co” las fórmulas de Frege al simbolismo lógico actual, enriquecido con la 
notación fregeana para nombrar recorridos. En particular, reemplazo el signo 
fregeano de identidad *=” por nuestro signo *=" cuando figura entre nombres 
de objetos, y por nuestro signo de equivalencia <>” cuando figura entre ora- 
ciones. Apelaré asímismo a reglas de inferencia y teoremas familiares de la 
lógica proposicional y predicativa, todos los cuales pueden por cierto validarse 
en el sistema de Frege (sin recurrir al Axioma V). 
“Traducido”, el Axioma V reza así: 


VGVF(éFe = 4Ga << Vu(Fu < Gu)) (v) 
Con nuestros símbolos de conjunción y cuantificación existencial, combina- 


dos con la notación ¿D(e), se puede expresar perspicuamente, mediante la 
fórmula 3G(¿Ge = A A AGA), que Á es una clase que no pertenece a sí misma. 


Frege (1903, p. 256) emplea la fórmula —S S(A) la cual equi- 
Lu—6te)) ib 

vale lógicamente a la anterior, aunque sería más exacto traducirla así: 

VG(éGe = A > GA). La clase de todas las clases que no se pertenecen a 

sí mismas debe, pues, designarse con el nombre del recorrido de la función 

TV G(¿Ge = E > G8), vale decir, ¿(VG(é¿Ge = e > Ge)). En aras de la 

brevedad, denotaré este objeto con la constante k.% Así, por definición: 


Según esto, NE(A = e) = A es lo verdadero y WD(g)” denota el objeto que cae 
bajo el concepto D(£) si D(¿) es un concepto bajo el cual cae un y sólo un objeto. 
En todos los demás casos, WD(£)” denota lo mismo que “¿D(g)”. 


ds Frege también usa una abreviatura para nombrar la clase de todas las clases que perte- 


necen a sí mismas, pero, como cabía esperar, es mucho más rebuscada que la adoptada 
aquí. Usa la letra A invertida, creando así —con otro significado— el símbolo moder- 
no del cuantificador universal (V). 
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¿OVG(éGe = e€ > Ge)) = k (1) 


Si en el Axioma V ejemplificamos las variables predicativas F y G, respec- 
tivamente con las funciones Hé€ y VG(éGe = € > G€), deducimos la pro- 
posición siguiente: 


¿He = (VG(éGe = e > Ge)) O Vu(Hu > VG(¿Ge = u > Gu)) 
(2) 


Para facilitar la comprensión de los pasos siguientes abrevio con Vu'P(u) la 
subfórmula a la derecha del primer signo <>. La convención (1) me permite 
reemplazar con ¿He = k la subfórmula a la izquierda de dicho signo. Usando 
estas abreviaturas, (2) se escribe: 


¿He = k o VuY(u) a) 


(La) implica que ¿He = k > VuY(u). De esta fórmula —utilizando el esque- 
ma (12) del Apéndice XIII (p. 518)— se deduce la fórmula siguiente: 


VuléHe = k > Y (u)) (3) 
Ejemplificando la variable individual u con el objeto k, obtenemos: 
¿He = k o Y(k) (4a) 


Si recordamos que “Y(u) representa el alcance del cuantificador Vu en (2), 
vemos que (4a) abrevia la fórmula siguiente: 


¿He = k O (Hk O VG(éGe = k > Gk)) (4) 
La proposición (4) implica que:?” 
VG(éGe = k > Gk) > (¿He = k > Hk) (5) 


39 (4) es una función veritativa de los componentes ¿He = k, Hk y =VG(éGe = k > Gh), 


que representaremos con P, O y R, respectivamente. Un breve cálculo permite compro- 
bar que (PS (0 >R) > (R > (P > 0)) es una tautología. 
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Como H es una variable predicativa arbitraria que no figura en las premisas 
iniciales de nuestra deducción, es lícito generalizar: 


VHWVG(éGe = k > Gk) > (¿He = k > Hk)) (6) 
Invocando los análogos de segundo orden de los esquemas (12) y (7) del 
Apéndice XIII, derivamos de (6) la proposición (7), que Frege deriva directa- 
mente de (5): 

VG(éGe = k > Gk) > VG(éGe = k > Gk) (7) 
Por otra parte, mediante una simple aplicación del Axioma Hb de Frege 1893 
(que es la versión de segundo orden del Axioma 58 de Frege 1879, reprodu- 
cido arriba en la p. 503), obtenemos: 


VG(éGe = k > Gk) > (¿He = k > Hk) (8) 


Reemplazando la función arbitraria Hé con "VG(éGe = E > GU), deduci- 
mos: 


VG(éGe = k > Gk) > 
(EF VG(éGe = e + Ge)) = k > VG(éGe = k > Gk)) (9) 


Utilizando la convención (1), (9) se puede abreviar así: 
VG(é¿Ge = k > Gk) > (k = k > VG(éGe = k > Gk)) (10) 
Por lo tanto, 
VG(é¿Ge = k > Gk) > VG(éGe = k > Gk)) (1) 


Sustituyendo P por VG(é¿Ge = k > Gk) en la tautología (P > P) > =P y 
aplicando la regla modus ponens deducimos: 


VG(éG(e) = k > Gk) (12) 
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De (12) y (7), por modus ponens, se deduce: 
VG(éGe = k > Gk) (13) 
que combinada con (12) da 
VG(éGe =k > Gk) a AVG(éGe = k > Gk) (14) 


La contradicción (14) es una consecuencia lógica del Axioma V de Frege 
combinado con sus demás axiomas y reglas de inferencia. (14) implica, a su 
vez, todas las proposiciones enunciables en BS. 

En el mismo Epílogo que contiene la deducción anterior, Frege sugiere 
un remedio. Descompone el Axioma V en dos implicaciones: 


VGVF(Vu(Fu <> Gu) > ¿Fe = 4:Ga,) (Va) 
VGVF(¿Fe = 4Ga > Vu(Fu <> Gu)) (Vb) 


Según él, la paradoja de Russell es una consecuencia de (Vb). El remedio 
propuesto consiste en reemplazarla por 


VGVF(¿Fe = 4Ga > Vulu + ¿Fe > (Fu < Gu))) (Vb') 


Años más tarde, Lesniewski (en 1938; vide Sobociíski 1949), Quine (1955) 
y Geach (1956) demostraron que el sistema así modificado implica una con- 
tradicción si suponemos que existen por lo menos dos objetos.* Pero Frege 


da Resnik 1980, pp. 214ss., explica bien este asunto. Al comienzo de su exposición Resnik 


observa que (Vb) es manifiestamente incompatible con el Teorema de Cantor (cuya 
demostración —como vimos en la p. 50— sugirió a Russell su paradoja). En efecto, 
podemos entender que el Axioma V postula la existencia de una aplicación del reino 
de los conceptos en el universo de los objetos, y, en tal caso, (Vb) dice que dicha 
aplicación es inyectiva. Según Resnik, ello contradice el Teorema de Cantor, conforme 
al cual “hay más conjuntos de objetos que objetos” (1980, p. 214). Esta observación 
me parece muy confusa. Los conjuntos de objetos, en el sentido de Cantor, también 
son objetos, no conceptos, y lo que el Teorema de Cantor dice es que si S es un con- 
junto cualquiera de objetos —sean ellos objetos individuales o conjuntos— no puede 
haber una aplicación inyectiva de PS en S, donde PS es el conjunto de objetos cons- 
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debe haber sabido que su remedio no servía, puesto que después de 1903 
dejó de interesarse en la derivación de las verdades aritméticas de leyes ló- 
gicas. 


XIII 


FÓRMULAS PRENEXAS 


Este es un suplemento del Apéndice IX. Me referiré específicamente a una 
versión del CP1= que contenga un número ilimitado de predicados n-ádicos, 
para cada entero n > 0; pero todo lo que digo puede aplicarse, mutatis 
mutandis, a otros cálculos análogos, de orden primero o superior. Recorde- 
mos que si a. es una fórmula y € y € son variables, 0, es la fórmula que se 
obtiene al sustituir € por € en todas las posiciones libres de € en a. 

Es fácil mostrar, apelando a las reglas semánticas, que los siguientes esque- 
mas representan fórmulas válidas: 


(1) Al <> 0 

(2) a + Via 
(3) Véa <> Ja 
(4) Véa + Jia 
(5) Ja O Véa 


Usaré en adelante la letra Q para representar indistintamente los signos de 


tituido por las partes (subconjuntos) de S. Sólo si presuponemos que cada concepto 
determina un objeto que le corresponde en forma exclusiva —sea éste su extensión 
clásica, su recorrido fregeano, o lo que se quiera— podemos relacionar las correspon- 
dencias entre objetos a que se refiere el Teorema de Cantor con la correspondencia 
entre conceptos y objetos postulada por el Axioma V de Frege. 
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cuantificación V y 3. Sabemos que, si £ es una variable, Q8u es una fórmu- 
la si y sólo si a es una fórmula. En tal caso, a. es el alcance del cuantificador 
Q8, el cual liga la variable € en la posición que € tiene dentro de él y en 
todas las posiciones libres que £ ocupa en a. Entenderemos que Q represen- 
ta el mismo signo de cuantificación todas las veces que ligue una misma 
variable en una expresión dada. 

Sea a una fórmula en que la variable £ no ocupa ninguna posición libre. 
Entonces todas las fórmulas representadas por el esquema siguiente son vá- 
lidas en virtud de las reglas semánticas [L,], [L£] y [L_]: 


(6) Qí6a > a 


Por lo tanto, Qu y a se pueden sustituir mutuamente en cualquier fórmula 
B en la cual una de ellas figure como subfórmula, sin que dicha sustitución 
afecte la verdad o la falsedad de PB. Decimos, por eso, que el cuantificador 
Q8 está ocioso en la fórmula Qéa. 

Por otra parte, si [Bes una fórmula cualquiera en que la variable € no 
ocupa ninguna posición libre, y ninguna posición de € en f cae dentro del 
alcance de un cuantificador que ligue a £, es fácil comprobar que, según las 
reglas semánticas del CP1=, 


(7) Q8P > QLB oz 


Diré que una fórmula q es regular si cumple las siguientes condiciones: 
(1) $ no contiene ningún cuantificador ocioso; (11) ninguna variable ligada en 
B por un cuantificador ocupa en $ posiciones donde esté libre o ligada por 
otro cuantificador. Obsérvese que si una fórmula es regular, también son 
regulares todas sus subfórmulas. Aplicando repetidamente (6) y (7) se puede 
construir, para cada fórmula y, una fórmula regular lógicamente equivalente 
a y. Hay muchos modos de hacerlo, pero es fácil prescribir un método que 
determine una fórmula regular única y* tal que (y £ wy*) sea válida. En- 


+1 Por ejemplo, se puede adoptar el método siguiente. Sea (Q;,....,Q,) la lista de los 
cuantificadores no ociosos de y, en el orden de sus posiciones respectivas, y € 1, Ep, .-- 
las secuencia de las variables que no figuran en y, ordenadas según el número de palotes. 
Sea y* la fórmula resultante cuando y es sometida a las operaciones siguientes: (1) 


eliminar todos los cuantificadores ociosos; (ii) reemplazar por £; la variable ligada por 
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tonces y* es la fórmula regular correspondiente a y. 

Suponemos que en las equivalencias (8)-(14), el esquema a la izquierda 
del signo <> representa una fórmula regular. Recordando que (a > B) > 
Ea vB) y (a AB) o za vB) son válidas, es fácil establecer la validez 
de: 


(8) (Qíu v B) > Qóa v B) 
(9) (a v QEB) > Qó(a v B) 
(10) (Qu a B) O Qóa a B) 
an (a a QEB) > Qía a B) 
(12) (a > QÉB) O Qó(a > P) 
(13) (Véa > PB) O Jé(a —> B) 
(14) Góa > BP) O Véa —> B) 


Y si tenemos en cuenta que (a <> PB) equivale lógicamente a (a a PB) v (Ta 
A =P), un breve cómputo confirmará que: 


(15) (Véa e B) > VESE(a a B) v (age n Bb) 
(16) Béa > B) o JEVE(A a B) v (age n B)) 


donde (Qéa <> PB) es regular y € es una variable que no figura en al ni en Pf. 
Como (PB £< Qéa) equivale lógicamente a (Qu <> f), también son válidas 
las fórmulas que se obtienen intercambiando Qéu y f en la subfórmula que 
precede inmediatamente al segundo signo <> en (15) y (16). 

Siguiendo a Whitehead y Russell, llamaré matriz a una fórmula que no 
contiene cuantificadores. Una fórmula prenexa es una fórmula que consta de 
una fila de cuantificadores seguida de una matriz. La fila de cuantificadores 


el cuantificador Q; en todas las posiciones en que dicho cuantificador la liga en y. 
Entonces, si y es la formula (VxPlxz > Vx.1x (Pxix), > Io Vxa(Plx, O P?x,x3))), 
yw* es la fórmula (Pla > Vxydxs(P?xsxp > Ax Vi Plxgo P?x5x3))). 
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que precede a la matriz es el prefijo de la fórmula. Cada fórmula q es lógi- 
camente equivalente a una fórmula prenexa regular, que puede construirse a 
partir de q en los cinco pasos siguientes: 


(69) Se construye la fórmula regular $* correspondiente a (. 

(11) Se sustituye en p* cada subfórmula de la forma (a —> f) por otra 
de la forma (a. v fB) y cada subfórmula de la forma (a <> PB) por 
otra de la forma ((a. A PB) v (ta a B)); la fórmula q, obtenida 
mediante estas sustituciones es, como sabemos, lógicamente equi- 
valente a p*. 

(11) Se construye, mediante repetidas aplicaciones de (1), una fórmula 
Q, lógicamente equivalente a q, en la cual no hay dos signos de 
negación consecutivos. 

(iv) Mediante repetidas aplicaciones de (2) (5), se obtiene una fórmula 
Q3 lógicamente equivalente a $, en que ningún signo de negación 
precede inmediatamente a un cuantificador. 

(v) Mediante repetidas aplicaciones de (8) (11), se obtiene una fórmula 
prenexa dd, lógicamente equivalente a b. 


Evidentemente, (pb <> (4) es válida. Como se puede ver, gracias al paso (11), 
no hace falta recurrir a (12)(16).2 

Una fórmula prenexa de Skolem es una fórmula prenexa en que cada 
cuantificador universal precede a todos los cuantificadores existenciales (SWL, 
p. 104).4 Skolem (1920) estableció un importante resultado que en nuestros 
términos se deja enunciar así: 


Observemos de paso que dos fórmulas prenexas son equivalentes si difieren sólo en el 
orden de los cuantificadores consecutivos de la misma clase. Pues es claro que (p <> 
y) es válida, si y es la fila aVEVEB y y es aVEVEB o si y es aJEJEB y y es aaC3EP, 
donde a es una fila de cuantificadores de longitud > O y $ es una fórmula prenexa o 
una matriz. 


43 Muchos libros de texto —desde Hilbert y Ackermann 1928— definen, a la inversa, 


una fórmula prenexa de Skolem (o “fórmula en la forma normal prenexa de Skolem”) 
como una fórmula prenexa en que cada cuantificador existencial precede a todos los 
cuantificadores universales. Como ésta no es la definición de Skolem, llamo a las fór- 
mulas que la satisfacen fórmulas prenexas de seudo-Skolem. 
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FPS Si y es una fórmula, hay una fórmula prenexa de Skolem Y“? tal 
que q es realizable si y sólo si $“? es realizable.* 


La demostración se facilita mediante el siguiente arreglo: si yw es una fórmu- 
la en la que r variables diferentes £,,..., £, ocupan posiciones libres, intro- 
ducimos un predicado r-ádico II (que no figura en y) que caracterizamos 
mediante la definición siguiente VE, ... VE, (IE, ...8E,< vw). Es claro que 
y equivale lógicamente a la fórmula elemental Ig, ...€,.4 Para aligerar el 
texto usaré la negrita para representar filas de símbolos similares, como se 
explica en la p. 491. Por ejemplo, Q(* representa una fila de k cuantificadores 
mixtos. Sea ( una fórmula cualquiera y q” una fórmula prenexa regular lógi- 
camente equivalente a ( construida según el método descrito arriba. Si Y” no 
es una fórmula prenexa de Skolem, su prefijo contiene por lo menos una fila 
de cuantificadores existenciales consecutivos seguida inmediatamente por un 
cuantificador universal. Sea b((”) el número de tales filas. Consideraremos 
en primer lugar el caso en que b(4') = 1. Entonces Q” tiene la forma 
Vn"18E'Wía, donde a. es una matriz o una fórmula prenexa cuyo prefijo 
contiene sólo cuantificadores existenciales. Como a es regular, contiene m + 
h + k+r variables libres diferentes (r > 0). Por lo tanto, q” equivale lógica- 
mente a 


( 1 7) Vn”3 EWCTIy"” g Ux 


donde II es un predicado (m+h+k+r)-ádico definido —como propuse arri- 


44 Como la negación de una fórmula prenexa de Skolem equivale lógicamente —en vir- 


tud de (4) y (5)— a una fórmula prenexa de seudo-Skolem, el resultado enunciado 

equivale a este otro: Si f es una fórmula, hay una fórmula prenexa de seudo-Skolem 

47% tal que y es válida si y sólo si $7" es válida. 
AS La aplicación de un arreglo como éste a cada fórmula con variables libres —sugerida 
por la misma notación en el cálculo de relativos de Schróder empleado por Skolem— 
es legítima también en la versión del CP1= con un repertorio ilimitado de predicados 
que consideramos en este apéndice. En el caso de una fórmula ( perteneciente a una 
versión del CP1= sin tal repertorio ilimitado de predicados, se puede probar que hay 
una extensión de esta versión que se distingue de ella sólo en cuanto contiene cierto 
número adicional de predicados y en la cual puede construirse una fórmula prenexa de 
Skolem que es realizable en una interpretación de la versión extendida si y sólo si q es 
realizable en una interpretación de la versión original. 
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ba— por Wn"”WE"W Vx" In" "xo a). Sea Q un predicado (m+h)-ádico 
que no figura en q. Postulamos que 


ed Vo"Vi (QoS Vx VETO" Ex) 


(donde la subfórmula que sigue inmediatamente a la doble flecha contiene 
precisamente m + h variables libres). Ahora bien, (18) equivale lógicamente 
a 


(19) Vo"Vi(Q0"1* y Vx ViTlo"rtztx") 
Axial y Qo”r”)) 


y por ende a 


(20) Vo"W1 "Vx VG'3 M3 v(00"r V Ho”*íx) 
A(Qo”r? y [107 Mv”)) 


Por otra parte, en virtud de (18) y (7), tenemos que (' equivale lógicamente a 
(21 ) Vn”3 EO0y"r 


La conjunción de (20) y (21) equivale a la siguiente fórmula prenexa de 
Skolem: 


(22) Wn"Vo"WrWx Wi M3 v'3 E(Oy"E" A 
(Q0”r V Ho” ix) A (Q 0”7? V =1107"Mv”))) 


Es claro que (22) es realizable sólo si lo son (21) y su equivalente d'. Por 
otra parte, si |” es realizable, esto es, si hay una interpretación (%,f) tal que 
F(4') = O, hay también una interpretación (%,f,) tal que f, concuerda con f 
en todas las subfórmulas de p' y f¡(Q) es precisamente la clase de (m-+h)- 
tuplos de elementos de Y que, antepuestos a cualquier (k+r)-tuplo de tales 
elementos, integran la clase de (m+h+k+r)-tuplos f,(1D.* De esto se sigue 
que f,(0') = £,((18)) = f,(Q2)) = 0 —ya que (22) equivale lógicamente a la 


46 En jerga matemática, f¡(Q) es la proyección de f (ID) < Dx Dr sobre Q+. 
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conjunción de q” y (18). Por lo tanto, (22) es realizable si q” lo es. Con esto 
se completa la demostración de FPS en el caso especial en que b(p') = 1. En 
el caso general, (' tiene la forma Qy”3€'Wí'a, donde Qn” es una fila mix- 
ta de cuantificadores que termina con un cuantificador universal. Mediante 
un razonamiento igual al anterior probamos que q” es realizable si y sólo si 
lo es una fórmula y que difiere de (22) únicamente en que y comienza con 
la fila mixta Qn” en vez de Vn”. y no es prenexa de Skolem, pero está más 
cerca de serlo que d*, por cuanto h(4') = b(w) + 1. Nuestro razonamiento es 
aplicable a y y repitiéndolo un número finito de veces se obtiene una fór- 
mula prenexa de Skolem que es realizable si y sólo si q” es realizable. Dicho 
de otro modo: el resultado de Skolem que llamé FPS se establece para cual- 
quier fórmula q por inducción sobre el número b de filas de cuantificadores 
existenciales consecutivos que preceden inmediatamente a un cuantificador 
universal en una fórmula prenexa ordinaria que equivalga lógicamente a q. 


XIV 


EL CÁLCULO DE PREDICADOS MONÁDICOS ES DECIDIBLE 


Diré que un cálculo lógico es decidible con respecto a la validez o v-decidible 
si hay un algoritmo para determinar mediante un número finito de operacio- 
nes simples si una fórmula cualquiera de ese cálculo es o no válida. Como 
se narra en el Capítulo 2.7, Lówenheim (1915) demostró un teorema del cual 
se deduce que el cálculo de predicados monádicos —esto es, aquel fragmen- 
to del CP1= (o de otro cálculo lógico equivalente o análogo) que no contie- 
ne predicados poliádicos— es v-decidible. Bernays y Schónfinkel (1928, pp. 
352-355) dieron una demostración muy elegante del mismo resultado, que 
presento aquí en una forma adaptada a la notación del Apéndice IX. Para no 
distraer al lector con detalles sutiles pero inesenciales, expondré primero una 
demostración aplicable a fórmulas sin functores, y luego daré las indicacio- 
nes necesarias para generalizarla. 

Llamemos CP1p al fragmento del CP1 que sólo contiene predicados mo- 
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nádicos y O-ádicos. Sea a una fórmula cualquiera del CP1p1. Traducido a 
nuestro modo de hablar, el teorema demostrado por Lówenheim dice que si 
a. es verdadera en toda interpretación del CP1pL en un dominio finito (esto 
es, si no hay un entero positivo n y una interpretación (%,f) tal que I9| = n 
y fía) = 1), entonces a es válida (esto es, f(a.) = O cualquiera que sea la 
interpretación (9,f)). Ahora bien, si a. no es válida, 50. es realizable, de modo 
que la aseveración precedente equivale a esta otra: si [3 es una fórmula del 
CPlp y $ es realizable, entonces $ es realizable en un dominio finito (esto 
es, hay un entero positivo n y una interpretación (9, f) tal que Il =n y (PB) 
=0). 

Sea q una fórmula realizable del CP1p en la que figuran k predicados 
monádicos diferentes, II,,....,II,; 6 puede contener cualquier número finito 
n 2 0 de predicados O-ádicos (“variables proposicionales”). Demostraré que 
4 es realizable en un dominio Y tal que Il = 2*, Sea (L'*,f*) una interpre- 
tación tal que l*l > 2* y f*() = 0. Como sabemos, f* asigna a cada pre- 
dicado Il, (1 < /h < k) un conjunto —posiblemente vacio— f*(II,) c W*. Si 
a es un elemento cualquiera de 9*, f* le asocia lo que llamaré su signatura 
c(a) y que defino así: c(a) es un k-tuplo de ceros y unos cuyo h-ésimo tér- 
mino es igual a O siae f*(I1,) y es igual a l sia g f*(11,). Obviamente, 
no hay más que 2% signaturas diferentes entre las cuales se reparten todos 
los objetos del dominio 2*, cualquiera que sea su cardinalidad. Ordenémos- 
las lexicográficamente y llamemos 9; al conjunto de elementos de 25% que 
comparten la j-ésima signatura. Sea Y = (W,,... Loa). Diré que una inter- 
pretación (%,f) se ajusta a (2n*,f*) si satisface las tres condiciones siguien- 
tes: (1) D, € F(UI,) si y sólo si Y, € FUL,) A <h<k,1<j< 24); (11) si € 
es una variable individual que figura en q, F(É) = (x e D*lo(x) = o(f$*(E))+,P 
y (111) si Y es un predicado 0O-ádico que figura en q, F(Y) = f*(Y). Demos- 
traré que si (D,f) se ajusta a (Y*,f*%) y, como hemos supuesto, f*(p) = 0, 
también f(p) = O. Ello es evidente si y es una fórmula elemental Y o IIS, y 
se establece fácilmente por inducción con respecto al número de conectivos 
si y no contiene ningún cuantificador. Supongamos ahora que q es una fór- 
mula prenexa (Apéndice XIII). Razonamos por inducción con respecto al 
número q(p) de cuantificadores en q. Ya vimos que la tesis puede demos- 


4 En otras palabras, f(£) e Y es el conjunto de objetos que comparten la signatura de 


FO € A. 
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trarse para el caso q(p) = 0. Supongamos que se la ha establecido también 
para fórmulas prenexas con r cuantificadores, y que q(p) = r + 1. Entonces 
hay una variable € y una fórmula prenexa y con r cuantificadores y los k 
predicados II,,... II, tal que $ = 38y o q = V¿y. En el primer caso, f£*(4) 
= 0 implica que f¿*(y) = 0 en alguna ¿-variante f¿* de (9*,f*) de suerte 
que, por la hipótesis inductiva, hay una S-variante f, de (D,f), ajustada a 
(Y*,f*), tal que f¿(w) = 0; por lo tanto, F(6) = 0. En el segundo caso, f£*(h) 
= 0 implica que f¿*(y) = 0 en toda E-variante f¿* de (*,f*). Debido a la 
finitud de 9, cada E-variante f¿ de (9,f) se ajusta a alguna E-variante de 
(Q*,f*), de suerte que, por la hipótesis inductiva, f¿(w) = 0. Esto implica 
que f(p) = O. Ahora bien, como se vio en la p. 519, si q no es una fórmula 
prenexa, existe siempre una fórmula prenexa (' lógicamente equivalente a b, 
cuyo valor, por ende, es idéntico al de f en cualquier interpretación. Por lo 
tanto, f*(p) = O implica que f*(9') = 0; pero entonces, según acabamos de 
probar, f((') = O, de modo que f(p) = 0. Por lo tanto, si una fórmula cual- 
quiera q del CP1p es realizable en un dominio cualquiera, q es realizable en 
un dominio finito. 

De esto se sigue que el CP1p es v-decidible, ya que la realizabilidad o no 
realizabilidad de una fórmula dada q en un dominio finito Y puede deter- 
minarse en un número finito de pasos, calculando el valor de q en cada una 
de las interpretaciones en Y que Q admite. 

Doy para terminar el complemento anunciado, que permite extender el 
resultado anterior a las fórmulas con functores. Llamemos CP1p= al frag- 
mento del CP1= que no contiene predicados poliádicos y supongamos que 
el argumento anterior se refiere a una fórmula q del CP1pL=. Para que que 
el argumento sea concluyente tenemos que agregar una cuarta condición a 
las tres arriba prescritas para una interpretación (9,f) que se ajusta a (D*,f*). 
La nueva condición concierne a la interpretación de los functores. Considé- 
rese la aplicación 0: Y* => Y que asigna a cada objeto a el conjunto de los 
objetos que tienen la misma signatura que a. Como es habitual, llamo 0” a 
la “aplicación producto” que envía cada n-tuplo (a,,.... a,) e D*” al n-tuplo 
(O(a,), ... O(a,)) € Y”. Entonces, diremos que (9,f) que se ajusta a (*, f*) 
sólo si, además de (1) (iii), cumple la condición siguiente: (iv) si f es un 
functor n-ario que figura en q, f(b) o 0” =0 o f*(b) (en otras palabras: si 
f*(0) envía el n-tuplo (a,,... ,a,) e D*" a cierto objeto a e W*, £(b) envía 
el n-tuplo (0(a,),... O(a,)) € Y” precisamente a O(a)). 
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EL CÁLCULO PROPOSICIONAL ES COMPLETO 


Como dije en el Capítulo 2.7, Post (1921) demostró que toda fórmula del 
cálculo proposicional que sea “positiva” en su interpretación algebraica — y 
por ende válida en la interpretación lógica habitual — es deducible por sus- 
titución y modus ponens de los axiomas de su Postulado IV. La demostra- 
ción es constructiva, en cuanto enseña a construir una deducción apropiada 
para cada fórmula positiva dada. Imitando a Post, la divido en cuatro etapas. 
Aunque la definición de fórmula que Post da en su Postulado 1 supone que 
los únicos conectivos son los signos de negación y disyunción, la demostra- 
ción discurre como si los signos de conjunción, implicación y equivalencia 
también pertenecieran al cálculo. 

[A] Digamos que una fórmula a tiene rango O —abreviado: H(a) = 0— 
si consta únicamente de una variable proposicional sin conectivos; que Hí(—0L) 
=1+09í(a), y que H(a v B)= 1 + max(HK(a),ÍUB)). Designemos con q(p) 
y p(q) a dos fórmulas cualesquiera tales que la segunda se deriva de la pri- 
mera reemplazando uniformemente cierta variable proposicional p por una 
variable proposicional q. Post prueba, por inducción sobre el rango de p(p), 
que toda aseveración de la forma H(p > q) > (q(p) > q(q)) es deducible 
de los postulados. Si Hi(p) = O, la tesis se reduce a una de las dos siguien- 
tes: (1) a Hp O q) > (p O q), que se deriva por sustitución del familiar 
teorema Hp > p)(1) a Hp O q) > (r O r), que se deriva por modus 
ponens y sustitución de Fp > (q > Pp) y Fr <> r. Si la tesis se supone vá- 
lida para fórmulas de rango menor que m, vale también si HK(p) = m + 1. En 
efecto, en tal caso p(p) puede escribirse en una de las formas (q ¡(p) v pp) 
o p,(p), donde max(H(0 ),H(p,)) = m; y la tesis se deriva por modus ponens 
y sustitución de los teoremas H(p £ q) > (pS D,HRSog>obo q 
y Hp Y 9) > (p O 9). Como Post señala en una nota, todos los asertos 
que aquí se invocan han sido deducidos en Principia Mathematica. 

[B] Si p(p,, . - . p,) es una fórmula que contiene k variables proposicionales 
diferentes, se puede probar que hay una fórmula Q'(p;,... pj) tal que 
FO(Pi --- Pi) > Q'(p¡ --- py), en la cual no hay otros conectivos binarios 
que v y », y el signo = sólo figura —si acaso— inmediatamente a la iz- 
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quierda de variables proposicionales. La prueba utiliza el metateorema de- 
mostrado bajo la letra [A] y tres teoremas deducidos en Principia, a saber, 
Ep V q) (Ep A 79), FP O p, y HP O q) > (q or) o (p o 1). 
[C] Invocando las propiedades distributivas y asociativas de v y A se puede 
establecer que HQ'(p;, ..- Pi) O (Y; Y... V Y,), donde cada subfórmula y, 
(1 <1<n) es una conjunción de variables proposicionales o sus negaciones 


en la cual cada variable p; (1 < ¡ < k) figura a lo sumo una vez precedida 
por el signo = y a lo sumo una vez sin ir precedida por dicho signo. Si la 
variable p, no figura en cierta subfórmula wy,, sustituimos esa subfórmula por 
(Y, A p,) Y (Y; A =p,). Sea y' el producto final de estas sustituciones; es 
claro que EQ'(p;,... pi) > w'.* Apelando otra vez a las propiedades 
distributivas y asociativas de v y A se construye una fórmula y tal que: 


(M Ey" O y 
(ii) Y =(0, APA TP) Y (025 Pp) Y (03 A py) 
(111) p, no figura en Q,, Q, y Q; 


[D] Es claro entonces que HQ(p;, ... pi) O V. Por lo tanto, si p(p,,... Py 
es positiva, también y es positiva (puesto que la positividad de una fórmula 
es una condición necesaria de su deducibilidad, como se mostró en las pp. 
256-57). La deducibilidad de y se prueba por inducción sobre el número de 
variables proposicionales que contiene. Si no contiene más que una, enton- 
ces y es idéntica a la fórmula (p v =p) o a la fórmula ((p A =p) v p v =p) 
o se deduce de una de ellas por simple sustitución de una variable por otra. 
Ambas fórmulas son deducibles de los axiomas.*” Supongamos ahora que y 
contiene k variables y la tesis se ha probado para cualquier fórmula positiva 
con menos de k variables. Si y es positiva, tanto q, como ey tienen que ser 
positivas.% Por la hipótesis inductiva, Hp, y Hz. De esto se deduce Ey, 


ki De +p v =p y Fp > (q > (p A q)) se deducen los teoremas FY; <> (Y; A (Pr Y =P1)) 


Y FlY; A (Pp Y PD)  ((Y¿ A py Y (Y; A pp). Por lo tanto, el metateorema [A] 
autoriza a deducir H(YW] VW... V VWY,) O V'. 


+ La segunda se deduce de la primera y el axioma Fp > (q v p). 


cd Supongamos (pz no es positiva, de modo que f(p>) = 1 para cierta asignación f de 


valores 0 ó 1 a las variables contenidas en (pz. Extendamos f a p; mediante la estipu- 
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aduciendo Fp > (q => (p E 9), Hp A 9) v (pA 79) E (PA (q Y 29), 
Ep > (q > [p AQ) y Fp > (q v p). Por lo tanto, se deduce asimismo 


Ep. Pp): QED. 


XVI 


UNA FORMA ABSTRACTA DEL 
PRIMER TEOREMA DE INCOMPLETUD DE GÓDEL 
(SMULLYAN 1992) 


Como se explica en la Sección 2.10.2, Gódel 1931 demostró sus teoremas 
de incompletud para un cálculo bien determinado P, aunque haciendo hinca- 
pié en que la conclusión podía extenderse a una vasta familia de “sistemas 
afines”. La siguiente versión “abstracta” del primer teorema, publicada por 
Smullyan (1992), aclara y precisa la índole de esa familia. 

Para motivar la exposición utilizaré palabras como “cálculo”, “oración”, 
“demostrable”, “verdadera”, pero no hay que perder de vista que un “cálcu- 
lo” aquí es un conjunto cualquiera y que las “oraciones” que llamo “verda- 
deras” o “demostrables” son sencillamente ciertas partes de ese conjunto que 
cumplen los requisitos que se indican. Por otra parte, cuando hablo de nú- 
meros me refiero a los números naturales (0, 1, 2,... ) en el sentido ordina- 
rio del término. Como se verá, la conclusión a que llegaremos sobre los 
“cálculos” depende solamente de ciertas relaciones de inclusión y exclusión 
entre sus partes y de dos relaciones, simples pero bien determinadas, entre 
el cálculo bajo consideración y el sistema N de los números. 

Un conjunto no vacío “€ es un cálculo en la presente acepción si y sólo si: 


lación f(p;) = 0. Es claro entonces que f(w) = 1, lo cual contradice la suposición de 
que y es positiva. Asimismo, si (pz no es positiva, tendremos que f'(p3) = 1 para cierta 
asignación f' de valores 0 ó 1 a las variables contenidas en (pz. Extendamos f' a pz 
mediante la estipulación f'(p,) = 1. Es claro entonces que f'(y) = 1, lo cual contradice 
la suposición de que y es positiva. 
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00) € incluye (i) un conjunto denumerable é de expresiones; (ii) un 
conjunto O < € de oraciones; (iii) un conjunto Y < O de oracio- 
nes demostrables; (iv) un conjunto R < O de oraciones refutables; 
(v) un conjunto Y < O de oraciones verdaderas; (vi) un conjunto 
XK < $ de predicados, 

009) existe una aplicación 0: d x N —= € tal que D(X x N) < O (la 
imagen de X x N por D está contenida en 0). 


La condición (I) se entiende sin dificultad, si uno se abstiene de atribuir 
un significado específico a las palabras en cursiva, introducidas únicamente 
para motivar la exposición. La aplicación postulada en (II) asigna a cada 
expresión E e 8 y a cada número n una expresión única que llamaré E(n). 
En particular, si la expresión es un predicado H, H(n) es una oración. Si 
H(n) e “V, decimos que el número n satisface el predicado H y que H se 
aplica a n. Decimos que el predicado H expresa el conjunto numérico K si 
K es precisamente el conjunto de los números a que A se aplica. En otras 
palabras, H expresa K si y sólo si H(n) e V <> ne K. El conjunto K es 
expresable en € si hay un He % Cc € que expresa a K. 

€ es un cálculo correcto si toda oración demostrable es verdadera y no lo 
es ninguna oración refutable. Nos interesa establecer las condiciones sufi- 
cientes para que un cálculo correcto contenga una oración verdadera que no 
es demostrable. (Esto es, la condición suficiente para que VXY + Y, dado 
que Y CV y R QA YV = 9). 

Como é es numerable, podemos asignar un número de identidad 4*[E] a 
cada expresión E. Supondremos que la aplicación ++:8 —= N es biyectiva, de 
modo que cada número natural es el número de identidad de alguna expre- 
sión. (véase el Apéndice XVID. Llamaré £,, a la expresión cuyo número de 
identidad es n. En otras palabras, n = 4[E,,]. (E, = t[n] en la nomenclatura 
del Capítulo 2.10). La diagonalización de E,, es la expresión E,(n). Si E, es 
un predicado, E,(n) es una oración. Esta oración es verdadera si y sólo si el 
predicado E, se aplica a su propio número de identidad. Las estipulaciones 
anteriores definen completamente la función A: N => N por n > *[E,(n)]. A 
es la función diagonal del sistema determinado por € y 4. 

Si K< N, llamo K' al conjunto NXK, esto es, el complemento de K con 
respecto a N. Normalmente llamaríamos A7(K) a la imagen inversa de K 
bajo la función diagonal A, pero para aligerar la tipografía, la llamaré K* 
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(como hace Smullyan). En otras palabras: ne K* <> A(nm) e K. 
Sea D el conjunto de los números de identidad de las oraciones 
demostrables de €: D= (x:xe N a E, e 9). Probaremos el siguiente 


TEOREMA: Si € es un cálculo correcto y el conjunto (D')* es expresable en €, 
VND HD. 


DEMOSTRACIÓN: Supongamos que “É es correcto y que el predicado H expresa 
el conjunto (D')*. Sea h = [HA]. Comprobaremos que la oración H(h) es ver- 
dadera pero no es demostrable. Si H expresa (D')*, entonces, para cada nú- 
mero n, H(n) € Y > ne (D'y*. En particular, H(h) € V o he (D)*, 
Ahora bien, he (D)* O A(h) € D' > A(h) £ D. Por definición, A(h) = 
FE, (M)] = ALA(M)] (puesto que h = +[A]). Por lo tanto, A(h) ¿ D £ H(h) € 
S. Uniendo nuestras tres cadenas de equivalencias, concluimos que H(h) e 
V O H(h) £ %. Tenemos pues que, o bien H(h) € SNV, o bien H(h) € 
VN9. Si € es correcto, IXV = W. Por lo tanto, H(h) e VNS x% W. 


XVI 


NÚMEROS DE GÓDEL: UNA ALTERNATIVA 


En las pp. 329-30 se explica el método adoptado por Gódel (1931) para asig- 
narle un número de identidad —lo que he llamado un *gódel?”— a cada ob- 
jeto de un cálculo lógico. El método de Gódel es muy elegante pero no 
permite determinar con facilidad cuál es el número asignado a cierto objeto, 
o el objeto que corresponde a cierto número. (De hecho, hay números a los 
que no corresponde ningún objeto). Desde 1931 se han introducido varios 
otros métodos. En las pp. 384-85 expliqué el adoptado por Turing para asig- 
narle un gódel a sus programas de cómputo. Siguiendo a Smullyan (1992), 
aplicaré aquí una variante del método de Turing a los objetos de un cálculo 
lógico. Para fijar ideas, me refiero al cálculo predicativo de segundo orden, 
CP2=, descrito en el Apéndice IX.H, pero el método se puede adaptar fácil- 
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mente a cualquier otro cálculo. 

Para empezar, se le asigna un dígito a cada signo del cálculo. El número 
denotado por ese dígito es el gódel de ese signo. El gódel de una fila de 
signos es el número denotado por la correspondiente fila de dígitos. Para 
que este método de identificación pueda extenderse a las listas de filas de 
signos, introducimos un nuevo signo <), para separar las filas de una lista. 
Estipulamos que (1) una fila de signos del cálculo que no contiene el signo 
O es una expresión; (ii) si a es una expresión, a es una lista de una ex- 
presión, y (iii) si a es una expresión y B es una lista de n expresiones, a OB 
es una lista de n+1 expresiones (n > 1). El CP2= tiene 18 signos, a saber, 
ADN VW) oO VJ3=6) ¡y *, x, X, F, a, P, f. Para aplicarle nuestro 
método de identificación tenemos, pues, que utilizar un sistema numérico con 
19 dígitos, esto es, un sistema de base 19. Los programadores, que usan un 
sistema de base 16, designan los números del O al 9 con los dígitos corrientes 
y los números 10, 11, 12, 13, 14 y 15 con las letras A, B, C, D, E y EF, 
respectivamente. Sigamos la misma convención, poniendo G = 16, H =17 y 
J = 18 (omito la I porque puede confundirse con el 1). Si asignamos el O al 
signo <> y los restantes dígitos a los signos del CP2= en el orden en que los 
presenté arriba, tenemos que el gódel de la fórmula WxPx es 6DHD, que 
equivale, en nuestro sistema decimal, a 6x 193 + 13x19 + 17x19+ 13 = 
46.183. Por otro lado, es claro que cualquier número es el gódel de un sig- 
no, una fila de signos o una lista de filas de signos. Por ejemplo, el número 
1.000.000 = 7x19*+ 12x19* + 15x19? + 1x19+ 11 = 7CFIB es el gódel de 
la expresión 3*X=, la cual, claro está, no es una fórmula. En situaciones 
especiales será oportuno adoptar otras convenciones. Por ejemplo, en el cál- 
culo que usa Smullyan, diseñado para representar la aritmética, hay una 
constante O que denota el cero, y un functor ”, “el siguiente de”, que se es- 
cribe pospuesto a su argumento. Así la expresión 0”” denota el número 4. 
Smullyan asigna el dígito 1 al signo O y el dígito O al signo '. Con estas 
convenciones, el gódel de la expresión que denota el número n se representa 
muy convenientemente —en el sistema numérico utilizado por Smullyan— 
con un 1 seguido de n ceros. 
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LOS AXIOMAS DEL CÁLCULO DE PRIMER ORDEN 
INVESTIGADO POR GÓDEL (1930) SON DERIVABLES EN 
EL CÁLCULO DE SECUENTES PROPUESTO POR GENTZEN (1938) 


Doy aquí varios ejemplos de derivaciones en el cálculo de secuentes utiliza- 
do por Gentzen en su segunda demostración de la consistencia de la aritmé- 
tica elemental (1938). Aunque el principal propósito de este apéndice es ilus- 
trar el concepto de derivación en dicho cálculo, explicado en la Sección 
2.12.1, aprovecho la oportunidad para mostrar que cada uno de los axiomas 
1-6 del cálculo de primer orden que Gódel (1930) demostró completo (Ca- 
pitulo 2.8) es la posfórmula (única) de un secuente sin prefórmulas derivable 
en el cálculo de Gentzen, y por lo tanto también se puede invocar como 
axioma en este último.*' 

Presento las derivaciones en forma de esquemas. Igual que en la presen- 
tación de los esquemas de inferencias en la Sección 2.12.1, las mayúsculas 
griegas representan listas de fórmulas separadas por comas; las mayúsculas 
góticas representan fórmulas y las minúsculas góticas, variables. A la dere- 
cha de cada conclusión anoto el tipo de inferencia utilizado para derivarla. 
Antes de derivar los axiomas de Gódel, doy el esquema de un “hilo” —en 
el sentido explicado en la Sección 2.12.2— que suele figurar en las deriva- 
ciones: partiendo de un secuente de la forma TP, Y > A, Y se puede derivar 
siempre el secuente correspondiente TP” > A, A v YB. 


Y Cada secuente > A, en que A es uno de los seis axiomas en cuestión, puede insertarse 


como secuente inicial en cualquier derivación, sobreentendiéndose que sobre él va una 
derivación como las dadas aquí. Obsérvese que los axiomas 7 y 8 de Gódel no pueden 
justificarse así, porque contienen el signo =, el cual no es un símbolo lógico del cálcu- 
lo de Gentzen. Pero el axioma 7 (x = x) es evidentemente la posfórmula única de un 
secuente básico matemático sin prefórmulas. También lo es el axioma 8, si exigimos 
que las fórmulas F(x) y F(y) que figuran en él sean elementales. 
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Tr, A > A, YB 
T>A, Y, —A (E) 
T>A, 8, A v (v) 
T>A, Av 9, (Permutación) 
TP > A, A y Y, A y Y (v) 
T>A Av Y (Contracción) 


Omitiendo las líneas 2-5 (y las rayas horizontales que las preceden), el es- 
quema precedente puede condensarse en el siguiente esquema de inferencia 
auxiliar que, siguiendo el ejemplo de los manuales de lógica, llamo teorema 
de la deducción (TD). 
TD T, A > A, B 
T > A, A v Y 

Ahora derivo los axiomas 1-6. Para ahorrar espacio, no anoto las permu- 
taciones efectuadas. 
1 1 Al > Al (SB | SB) 

Av A > (v) 


> (A v A) v A (TD) 
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2 A > A (SB) 
A> A v YD (v) 

== y ly 8) (TD) 

3 1 => Y a > (SB | SB) 
lA > Doy A a+ Dl (viv) 

AD > BD Y (v) 

=-Uv Dv (Bv) (TD) 

4 a! (SB) 
Er E 1=U,€ (SBldeb.) 

1, E> E A, A > E BD>—YBD (deb.l -ISB) 

A, EvA > E >EUy Y (viv) 

A, EvA> Cv YB EvYA)VBd>-ECvB  (videb.) 
AvYBDEvAr>ECv YD (v) 

A v Y, > (E y A) v (E yv D) (TD) 

> (Av D) v (E v A) v (E y D) (TD) 
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5 SW/) > YW/X) 
VIS > SOW/Y) 


> VIS v SW) 


6 A > A SW/) > YW/1) 


A > A, VIF SW/) > IQM/x), A 
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(v) 


(TD) 


(SBISB) 


(deb.! deb.) 


A> A, VIS, 3W/) — SQW/L) > 8/0), A, VES  (deb.Ideb.) 


Av FW > A, VIS, YW/1) 
Av 3/0 > A, VIS, VIS 


A v FW) > A, VIR 


A v I/O) > A v VIH, VIF 


A v OM > A v VI3, A v VIS 


A v WD > A v VIS 


> XA v IW/1) v QA v VIS) 


(donde |) es una variable que no figura en la fórmula Y) 


(v) 
(v) 
(contr.) 
(v) 
(v) 
(contr.) 


(TD) 
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ALGUNAS IDEAS DE BROUWER 


Luitzen Egbertus Jan Brouwer (1881-1966) alcanzó muy joven una concep- 
ción de la matemática radicalmente opuesta a la de los autores que estudia- 
mos en este libro. Ella se perfila claramente en su tesis doctoral (1907), sobre 
todo en la primera versión, cuyos pasajes más audaces suprimió por reco- 
mendación de su consejero, D. J. Korteweg (van Stigt, 1979). Korteweg le 
sugirió a su joven y extraordinariamente brillante discípulo que se aplicara 
primero a resolver problemas de la matemática tradicional, para asegurar su 
autoridad y prestigio. En cumplimiento de este plan, Brouwer sentó las ba- 
ses de la teoría topológica de la dimensión, demostrando que el número de 
dimensiones de un espacio es invariante bajo biyecciones bicontinuas (1911, 
1913). Tras este importante logro, con el cual rescató una intuición que 
muchos creían destruida por Cantor (vide p. 26), Brouwer empezó a publi- 
car artículos de carácter filosófico en las Actas de la Academia Neerlandesa 
de Ciencias y en revistas internacionales de matemáticas. 

Brouwer solía decir que sus ideas sobre la matemática emanaban de su 
personal concepción del mundo y de la vida. Esta tiene sólo un tenue víncu- 
lo —a través de Schopenhauer— con la tradición filosófica europea, y me 
confieso incapaz de comprenderla y explicarla.*? Por suerte, aquí busco sólo 
marcar el contraste entre Brouwer y el conjuntismo, y para ello no es preci- 
so calar muy hondo. Me limitaré a citar algunas palabras de Brouwer sobre 
la intuición fundamental que según él es la raíz de las matemáticas, para 
luego, a partir de ahí, resumir sus ideas sobre el infinito matemático y el 
principio del tercero excluido. 

Según Brouwer, el “fenómeno fundamental del intelecto humano” es “la 
disociación de los momentos de la vida en partes cualitativamente diversas, 
que sólo pueden reunirse en cuanto permanezcan separadas por el tiempo”; 


SE Cf. especialmente sus artículos “Matemática, ciencia y lenguaje” (1929) y “Concien- 


cia, filosofía y matemáticas” (1948), ambos reproducidos en Brouwer, CW, tomo I. En 
el mismo tomo, pp. 1-10, pueden consultarse extractos, traducidos al inglés, del libro 
juvenil de Brouwer, Vida, arte y mística (1905). 
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hecha abstracción de su “contenido emocional” este fenómeno pasa a ser “el 
fenómeno fundamental del pensamiento matemático, la intuición de la nuda 
duo-unidad (two-oneness)” (1913a; CW I, 127). 


Esta intuición de la duo-unidad, la intuición básica de las matemáticas, 
crea no sólo los números uno y dos, sino también todos los números 
ordinales finitos, en cuanto uno de los elementos de la duo-unidad puede 
pensarse como una nueva duo-unidad, y este proceso puede repetirse in- 
definidamente. Ello da nacimiento además al más pequeño número ordinal 
infinito (). Por último, esta intuición básica de las matemáticas, en la que 
se unen lo conexo y lo separado, lo continuo y lo discreto, genera inme- 
diatamente la intuición del continuo lineal, es decir, del “entre” que no se 
agota con la interposición de nuevas unidades y que, por lo tanto, no puede 
nunca pensarse como una mera colección de unidades. 

(Brouwer 1913a; CW I, 127-28) 


En la ponencia que presentó al IV Congreso Internacional de Matemáti- 
cos, titulada “Las potencias posibles” (1908a),* Brouwer fue más explícito. 
En la intuición originaria de la duo-unidad (Zweleinigkeit) se reúnen las in- 
tuiciones de lo continuo y lo discreto, “justamente porque lo segundo no se 
piensa por sí mismo, sino bajo retención del recuerdo de lo primero” (CW I, 
102). En este tener o sostener a lo uno con lo otro (Zusammenhaltung) con- 
siste precisamente la intuición de lo con-tinuo. Vaciada de su contenido, esta 
“sensación” (Empfindung) de lo fijo y lo evanescente juntos, de lo perma- 
nente y lo cambiante juntos, es la intuición matemática originaria. En ella se 
basan los dos desarrollos siguientes: 


(1) Uno piensa la intuición de la duo-unidad como una nueva unidad, a la 
que se agrega una nueva alteridad —llamada “tres*'— y así sucesiva- 
mente; de este modo se establece el tipo de orden de los números 
naturales, que Brouwer, como Cantor, llama 0. 

(Q) Al vivir la intuición originaria como tránsito entre lo primero y lo 
segundo se establece el tipo de orden n de los racionales mayores que 
0 y menores que 1, ordenados de menor a mayor. 


DE Recuérdese que Cantor llamó “potencia” (Máichtigkeit) a lo que en este libro llamamos 


“numerosidad”; cf. p. 21. 
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Según esto, no puede haber más que una numerosidad infinita, a saber, la 
denumerable. Con todo, Brouwer admite que se hable de una numerosidad 
superior en cualquiera de los dos sentidos siguientes: 

(a) Cada conjunto denumerable dado perteneciente a un sistema matemá- 
tico genera un nuevo elemento que también pertenece al sistema. Por esta 
vía sólo pueden construirse conjuntos denumerables, no el sistema comple- 
to, porque este no puede ser denumerable. “Es incorrecto considerar a este 
sistema entero como un conjunto matemático, pues no es posible terminar 
de edificarlo desde la intuición matemática originaria” (1908a; CW LI, 103). 
Brouwer propone estos ejemplos: la totalidad de los números de la segunda 
clase (vide pp. 37-38), la totalidad de los puntos definibles del continuo, la 
totalidad de los sistemas matemáticos. 

(b) Al continuo entre lo primero y lo segundo se lo puede considerar como 
una matriz generadora de unidades o puntos, y postularse que dos puntos 
deben considerarse distintos si y sólo si es posible distinguir sus respectivas 
posiciones en una cierta escala de tipo de orden n. “Se observa entonces que 
el continuo definido de este modo no puede agotarse nunca como matriz de 
puntos” (1908a; CW 1, 103). 

Brouwer concluye que existe sólo una “potencia” o numerosidad para 
conjuntos matemáticos infinitos, “a saber, la denumerable”. A ella cabe agregar 
(a) la denumerablemente inconclusa, “pero ello denota un método, no un 
conjunto”; y (b) la continua, la cual, sí, “denota algo terminado (etwas 
Fertiges), pero sólo como matriz, no como conjunto” (1908a; CW L, 104). 

A Brouwer se lo conoce en los círculos filosóficos sobre todo porque negó 
la validez universal del principio lógico del tercero excluido. El alcance y la 
justificación de su rechazo sólo se puede apreciar contra el trasfondo de las 
ideas precedentes. Brouwer no estaba en el negocio de crear una lógica al- 
ternativa, como la que, revestida de una parafernalia formal muy semejante 
a la que detestaba en sus adversarios, circula con el nombre de “lógica 
intuicionista”. Para él, la actividad matemática, alimentada de la intuición 
originaria, es extralingiística. El lenguaje matemático no es más que un re- 
curso defectuoso de los hombres para comunicarse las matemáticas unos a 
otros y para reforzar su memoria de las matemáticas (Brouwer 1907; CW 1, 
92). La verdad sólo se encuentra “en la realidad, esto es, en las experiencias 
presentes y pasadas de la conciencia”, las cuales incluyen cosas y sus cuali- 
dades, emociones, reglas (jurídicas, de cooperación, de juego), actos mate- 
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riales, actos de pensamiento, actos matemáticos (mathematical deeds). 


Las verdades suelen trasmitirse con palabras o complejos de palabras, 
generalmente tomados en préstamo de los lenguajes cooperativos, de tal 
modo que para el sujeto una cierta palabra o complejo de palabras siem- 
pre evoca una verdad determinada [...]. Hay además un sistema de re- 
glas generales llamado lógica, que permite al sujeto deducir de sistemas 
de complejos de palabras que trasmiten verdades, otros complejos de pa- 
labras que generalmente también trasmiten verdades. [... ] Ello no signi- 
fica que dichos complejos adicionales de palabras trasmitan verdades an- 
tes de que estas verdades se hayan experimentado, ni que estas verdades 
siempre puedan experimentarse. En otras palabras, la lógica no es un ins- 
trumento fiable para descubrir verdades y no puede deducir verdades que 
no fueran accesibles también de otra manera. 

(Brouwer 1948; CW I, 488) 


Brouwer se refiere expresamente a tres principios lógicos: el principio del 


silogismo,* el principio de contradicción y el principio del tercero excluido. 
Con respecto a ellos se plantea la cuestión siguiente: 


Supóngase que una construcción matemática intuicionista se ha descrito 
cuidadosamente con palabras y que luego, ignorando de momento el ca- 
rácter introspectivo de la construcción matemática, su descripción lin- 
gúística es considerada por sí misma y sometida a la aplicación lingiiís- 
tica de un principio de la lógica clásica. ¿Es siempre posible entonces 
ejecutar una construcción matemática sin palabras que halle expresión 
en la figura lógico-lingiiística en cuestión? 

(Brouwer 1952; CW I, 510; cursiva de Brouwer) 


Haciendo reserva de “la inevitable inadecuación del lenguaje como modo de 


descripción”, Brouwer admite una respuesta afirmativa en el caso de los 


principios de contradicción y del silogismo. En cambio, “salvo en casos es- 


eciales”, la respuesta es negativa en el caso del principio del tercero ex- 
8 


cluido, de modo que “este último principio debe rechazarse como instrumento 


S4 


Este principio infiere “de la inclusión de un sistema hb en un sistema c combinada con 
la inclusión de un sistema a en el sistema b, la inclusión directa de a en c” (Brouwer 
1908b; CW I, 109). Se trata, en suma, del esquema del modo barbara. ¿Pensaba Brouwer 
que todo silogismo podría reducirse a este solo esquema, sin recurrir a otros principios 
(excepto quizás el de contradicción)? 
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para descubrir nuevas verdades matemáticas” (Ibid.). La validez de este prin- 
cipio, dice Brouwer, equivale a la tesis de que no hay problemas matemáti- 
cos insolubles, para sostener la cual no tenemos el más mínimo indicio 
(1908b; CW I, 109). 

Naturalmente, el principio es enteramente admisible cuando se trata de 
sistemas finitos. Cada construcción de carácter finito y acotado en un siste- 
ma de esta clase puede intentarse solamente en un número finito de formas 
diferentes; cada intento, o bien tendrá éxito, o continuará hasta el punto en 
que se vuelva imposible. Por lo tanto, se puede siempre alcanzar una deci- 
sión sobre cualquier aserto concerniente a la posibilidad de una construcción 
de carácter finito y acotado en un sistema matemático finito. 

Para mostrar que ello no es así en el caso de los sistemas infinitos, Brouwer 
introduce el concepto de una propiedad fugitiva de los números naturales 
(1929; CW 1, p. 425). Diremos que la propiedad f es fugitiva si satisface las 
condiciones siguientes: 


1. Para cada número natural n es posible decidir si n tiene f o si es absur- 
do que n tenga f. 

2. No se conoce ningún método para calcular un número n que tenga f. 

3. No se puede probar que sea absurda la hipótesis de que existe un nú- 
mero natural que tiene f. 


He aquí un ejemplo sencillo. Digamos que el número natural n tiene la pro- 
piedad f, si y sólo el n-ésimo, el (n+1)-ésimo, el (n+2)-ésimo,..., y el (n+9)- 
ésimo dígito en la expansión decimal de rr, tomados en ese orden, forman la 
secuencia 0123456789. f, es una propiedad fugitiva. 

Brouwer usa el término A, para denotar el más pequeño número natural 
que tenga la propiedad fugitiva f, en el caso hipotético de que haya núme- 
ros que la tienen. Digo que x es un infra-número de la propiedad f six<As, 
y que x es un supra-número de f si A, < x. (Evidentemente, en el instante 
mismo en que se demuestre que un cierto número es un supra-número de f, 
f dejará de ser una propiedad fugitiva.) Considérese la secuencia de raciona- 
les a,, a,,.. . , definida por: 


k 
de =[-2) si k es un infra-número de f 


A 
E ) 
a = [1 si k es un supra-número de f 
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Es claro que la secuencia converge a un límite p,. También es claro que, si 
f es una propiedad fugitiva, tenemos que p, no es igual a O, pero tampoco 
es diferente de O. 

Hay importantes teoremas del análisis matemático que no pueden demos- 
trarse sin los recursos rechazados por Brouwer. Doy un ejemplo: Toda fun- 
ción continua q: 4 => R, definida en un intervalo cerrado 4 C R, tiene un 
máximo; en otras palabras, hay un a. e 4 y un entorno YU de a tales que 
p(a) > p(é) para todo E e UA $. Brouwer (1924; CW 1, p. 271) propone 
el siguiente caso en el cual, según él, este pretendido teorema no se cumple: 
Enúmerense las fracciones irreducibles, mayores que O y menores que 1, cuyo 
denominador es una potencia de 2, en el orden siguiente: (a) la fracción con 
menor denominador precede a la con denominador mayor; (b) cuando los 
denominadores son iguales, la fracción con menor numerador precede a la 
con numerador mayor. Las fracciones duales así ordenadas constituyen una 
secuencia de Cauchy 9,, 0,,... Sea A, el más pequeño número natural que 
tenga la propiedad fugitiva f, definida arriba. Sea q: [0,1] — R una fun- 
ción lineal en [0,6,,) y en (S,,,1], tal que ,(0) = p, (1) =0 y q, (9, ) = 2”. 
Sea 8,(x) = 0,1) sin=4A, y 8, (1) =0si nz A,. Entonces la función g, 


definida por g(x) = 2 g,(x), es una función continua, definida en el in- 


tervalo cerrado [0,1], que no tiene un máximo.*> 


Largeault 1992 y Mancosu 1998 son libros introductorios que recomiendo calurosa- 
mente a quien desee saber más sobre el intuicionismo. 


SOLUCIÓN DEL EJERCICIO EN LA PÁGINA 501. 
El alcance de — en su primera posición es la fila Vx,(P9x,x,13 v Jx,P?x,f?x,x3); el 
de Vx, es(Póx,x7x3 v Ix,P2x)f?x,x3); el de P? es x,x,x3; el de 31, es P?x,f?x,xy; el 
de — en su segunda posición es P?x,f?x,xy; el de ? es x,x3, y el de v es el par de filas 
(P3x yx 2x3, Jl P?x, fx 1x3). 


GLOSARIO 


El signo + indica que la palabra así señalada 
es materia de otro artículo de este glosario. 


El artículo Aplicación explica varios términos 
utilizados en el libro y en los otros artículos. 


Aplicación (alemán, Abbildung; francés, application; inglés, mapping). Sean 
G y H dos conjuntos cualesquiera. Una aplicación f de G en H asigna a 
cada elemento x e G un único elemento f(x) e H. Decimos que G es el 
dominio y H el codominio de la aplicación f. f(x) es el valor de f en el 
argumento x. El alcance de f es el conjunto V < H de los valores de f. Si 
el alcance V coincide con el codominio H, decimos que f aplica G sobre H 
y que f es una aplicación epiyectiva o una epiyección (F. surjection). Deci- 
mos que f es una aplicación inyectiva o una inyección (F. injection) si tiene 
valores diferentes en cada par de argumentos diferentes (esto es, si para todo 
Xx, y€ G,x% y implica que f(x) + f(y)). Si f es a la vez inyectiva y epl- 
yectiva, decimos que es una aplicación biyectiva o una biyección (F. bijection). 
Designamos la aplicación f de G en H mediante la expresión simbólica f: G 
—> H. La expresión simbólica f: x > f(x) dice que f asigna el valor f(x) al 
argumento x. Si A € G, el conjunto Lf(x):x e Aj se llama la imagen de A 
por f y se designa f(A4). Si B < H, el conjunto (x:f(x) e B) se llama la pre- 
imagen de B por f y se designa f-(B). 

Si f:G > H es una aplicación y F C G, la restricción de f a F (simbo- 
lizada f|F) es la aplicación f,: F —= H, definida por f,(x) = f(x) para todo 
x € F. Por otro lado, si f: G —> H es una aplicación y G < K, cualquier 
aplicación f,: K—= H definida de tal modo que f = f,IG es una extensión de 
faK. 

Considérense dos aplicaciones, f: G > H y g: H => K. Entonces, la apli- 
cación g of: G — K, x > g(f(x)) es la aplicación compuesta de f por g, 
la cual tiene, para cada x e G, un valor idéntico al valor de g en f(x). A 
veces, en vez de g o f, escribimos simplemente gf. 


541 
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El grafo de la aplicación f: G > H; x > f(x) es el conjunto de pares 
ordenados ((x,y) x€ G, y = f(x) e H). Mediante el concepto de grafo se 
suele dar la siguiente definición conjuntista de aplicación: Una aplicación f: 
G=>H,x= f0) es un trío ordenado (O,G,H), donde O = ((x,f(x)): x e G, 
FG) e H) y, para cada x, y e G, $00) f(y) sólo si x X y. 

Una aplicación f: G —> H cuyo dominio y codominio son conjuntos de 
números (naturales, enteros, racionales, reales o complejos) suele llamarse 
función. 

Supongamos que hay una relación n-aria R¿ entre los miembros del con- 
junto G. La aplicación f: G => H induce en H la relación n-aria R¡¿ definida 
como sigue: Si h,,...,h, € H, Ryglhy, ... , h,) sí y sólo si h, = f(81),..-, 
h, = F(81) Y R81 --- > 8n). Si Ryg coincide con una relación n-aria preexis- 
tente en H solemos dar a ésta el mismo nombre que a R¿ y decir que la 
aplicación f preserva esa relación. Por ejemplo, la función x > x? definida 
en el dominio de los números naturales preserva la relación binaria “mayor 
que”, puesto que x < y si y sólo si 1? < y?, (No así, en cambio, la función x 
> x? definida en el domino de los enteros, puesto que —x < —y implica que 
EY> DY) 


Boole, álgebra de. Consíderese un conjunto no vacío %B, en que se han dis- 
tinguido dos objetos O y 1 y se han definido una *operación algebraica unaria 
C y dos operaciones binarias A y U. Sean a, b y c elementos cualesquiera 
de %. La estructura (B,0,1,C, 5,1) constituye un álgebra de Boole si cum- 
ple con las siguientes condiciones B1-B11. Como es habitual, escribo a' en 
vez de C(a), y a b,a U b en vez de mía,b), V(a,b). 


B1 anb=bna 
B2 aub=bUA 
B3 aníbnc=(anbac 
B4 av(buc)=(aubjuc 


B5 avíbnc=(aub)na (au dc) 
B6 aníbuc=(anb)u(an dc) 
B7 aU(anb)=(aubjna=a 


BS au0=a 
B9 aui=1 
B10 aud =1 
B11 anda=0 
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Las operaciones U y A son pues conmutativas (B1, B2) y asociativas (B3, 
B4). Además, cada una es distributiva con respecto a la otra (B5, B6). Las 
condiciones B1-B7 implican que las operaciones U y NN son idempotentes 
(aUa=ayan a= a). Se puede demostrar que el álgebra de Boole 
(B,0,1,C,5,1) obedece a las leyes de De Morgan: (a UbY = ad NV y (a 
MN by = da U b'. Diremos que a es menor o igual que b (a < b) sí y sólo si 
a U b =b. (B,<) constituye un *orden parcial. En virtud de B8 y B9, 0 = 
min K y 1 = max B. Como aU(aub)=(ava)uUb=aU b, es claro 
quea<aub=b0U a. Por otra parte, con arreglo a B7, (ah b)UAa=a, 
de modo que a N b< a. 

Sea K un conjunto cualquiera, y PK su conjunto potencia (p. 3). Designa- 
mos con AN B la intersección de A y B, esto es, el conjunto (xix e A y x 
e By; conA U B la unión de A y B, esto es, el conjunto (1:xe Aoxe By; 
y con CA) el complemento de A en K, esto es, el conjunto KXA = fx:x € 
Kyxe A). La estructura (PK.D,K,Cym,u) es un álgebra de Boole. (De- 
muéstrelo el lector). Comúnmente, el contexto fija el conjunto K con respec- 
to al cual se toma el complemento, y escribimos A” en vez de CA); 


Cuerpo (alemán, Kórper; francés, corps; inglés, field). Sea (1,9) un *grupo 
abeliano, con elemento neutro O e %. Suponemos que 4 contiene por lo 
menos un elemento distinto de O. Sea 9: x W% —= HK una "aplicación tal 
que (1) (XXL(0),9) es un grupo abeliano con elemento neutro 1,' (ii) para 
cualquier ke X,k89 0=068 k =0, y (iii) cualesquiera que sean a,b,c € 
KX,a9S(b08c)=(48 b)0 (a9 c)=(b0 c) O a. Entonces, (3(,0,1,0,9) 
es un cuerpo. Sea a e %. Si a + 0, a tiene dos inversos: uno por O, que 
denotamos con —a, y uno por € que denotamos con a”*. Si a = 0, obvia- 
mente, es su propio inverso por € y no tiene un inverso por 8. 

El lector comprobará fácilmente que, si % es el conjunto de todas las frac- 
ciones (propias e impropias), O y 1 son el cero y el uno, y € y Y son, res- 
pectivamente, la adición y la multiplicación de fracciones, (4(,0,1,0,9) es 
un cuerpo: el cuerpo de los racionales, habitualmente llamado Q. 


l HKXRB designa el conjunto de todos los elementos de %f que no pertenecen a %. Por lo 
tanto, HILO) es el conjunto de todos los elementos de H con excepción de O. En 
rigor, habría que formular la condición (i) así: Sea O” la restricción de Y a (HKN407?; 
(KXL0),9') es un grupo abeliano con elemento neutro 1. Entonces, la regla (ii) carac- 
teriza a S como una extensión de O' a 3?. 
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El cuerpo |R de los reales se suele definir como una extensión de (Q), pero 
aquí daré la definición, menos intuitiva pero mucho más elegante, propuesta 
por David Hilbert en 1900. Sea |K = (3(,0,1,0,8) un cuerpo cualquiera. 
Supongamos que %' incluye una parte no vacía P C XK tal que (i) siae P y 
be P,_abbePyadbeP, y (ii) sia e K, a cumple con una y sólo 
una de las tres condiciones siguientes: a e P, a = 0,0 —a € P. En tal caso, 
decimos que P es el conjunto de los elementos positivos de IK y que [K es un 
cuerpo ordenado. Esta denominación se justifica porque la existencia de P 
determina en [XK la relación de 'orden lineal < definida por: a < b (léase: “a 
es menor que b”) si y sólo si b € -—a e P. Como es habitual, escribimos *a 
< b' por “a< boa = b”. Decimos que un elemento a e K es una cota 
superior del conjunto C <> %K sic <a para todo c e C. Si existe una cota 
superior de C, decimos que C es un conjunto acotado por arriba. En parti- 
cular, decimos que a, es el supremo O cota superior mínima de C si ay es 
una cota superior de C y cualquier otra cota superior de C es mayor que aj. 
(Los conceptos de conjunto acotado por abajo, cota inferior e ínfimo o cota 
inferior máxima se definen en forma análoga). Decimos que el cuerpo orde- 
nado IK es completo si todo conjunto C < $ acotado por arriba tiene una 
cota superior mínima. Decimos que el cuerpo ordenado [K es arquimédico 
si, cualesquiera que sean los elementos a, be [K, sia e P (esto es, si O < 
a) siempre existe un número natural n tal que b es menor que n veces a 
(vale decir, b<a 09 a 0 ... 8 0, con O repetido n veces). Se puede demos- 
trar que si |K y IX son dos cuerpos ordenados, completos y arquimédicos 
hay un *isomorfismo f: IK = [K', esto es, una biyección que preserva todas 
las propiedades estructurales de |K (por ejemplo: fía SY b) = f(a) S f(b), 
f(P) = P', etc.). Por lo tanto, es lícito hablar de una estructura única, |R, 
realizada por todo cuerpo ordenado, completo y arquimédico. |R se llama el 
cuerpo de los reales. (Obsérvese que (Q) es un cuerpo ordenado arquimédico, 
pero no completo: el conjunto de todas las fracciones cuyo cuadrado es mayor 
que 2 está acotado por abajo, pero no tiene una cota inferior máxima). 

Dado el cuerpo [KR de los reales, el cuerpo € de los complejos puede 
definirse como sigue. Un elemento de É —un número complejo— es cual- 
quier par ordenado de números reales: (a,b) e C si y sólo si a, be (R. En 
vez de (a,b) escribimos (a,b). La adición y la multiplicación de complejos 
se define como sigue: (a,b) + (c,d) = (a+b,c+d), (a,b) x (c,d) = 
(ac+bd,ad—bc), donde los signos +, — y x que figuran dentro de los parénte- 
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sis designan, respectivamente, la adición, la subtracción (esto es, la adición 
del inverso) y la multiplicación en R. En C, el elemento neutro de la adición 
es (0,0) y el elemento neutro de la multiplicación es (1,1). El lector puede 
tratar de probar que la estructura así definida es un cuerpo. 


Equivalencia. Sea € un conjunto cualquiera. Considérese una relación R entre 
pares de elementos de € tal que (i) R es reflexiva: cada elemento de € la 
tiene consigo mismo (simbólicamente: xRx); (11) R es simétrica: si a tiene la 
relación R con b, b tiene R con a (aRb => bRa); y (111) R es transitiva: si 
aRb y bKRc, entonces aRc. Si la relación R cumple estas condiciones decimos 
que R es una equivalencia. Dada una equivalencia R definida en un conjun- 
to €, los elementos de “€ pueden clasificarse en clases de equivalencia: a y 
b pertenecen a la misma clase de equivalencia si y sólo si aRb. Esta clasifi- 
cación es exhaustiva, puesto que, en virtud de (1) todo elemento de € tiene 
R con algo; además, en virtud de (111), las clases son mutuamente exclusivas. 
Por lo tanto, la clasificación de € en clases de equivalencia constituye una 
partición. 


Espacio topológico. Sea é un conjunto cualquiera. Decimos que Y < P(8) 
es una topología en € si cumple las cuatro condiciones siguientes: 


(1) te Y; 

(11) De Y; 

(11) si X e Y pertenecen a J, la intersección X A Y también pertenece a 
E 

(iv) si X;, X,,... es una lista (posiblemente infinita) de elementos de 


3, la unión U,.yX, de todos los elementos de la lista también es 
un elemento de Y. 


Un espacio topológico es un par (8,J) tal que É es un conjunto no vacío y 
J es una topología en 8. Llamamos puntos a los elementos de 8 y abiertos 
a los elementos de Y. Si X es un abierto, decimos que su complemento EX X 
es un cerrado. Este vocabulario se comprenderá mejor a la luz de las si- 
guientes explicaciones. Si (8,3) es un espacio topológico y x es un punto 
de 8, cualquier subconjunto de é que contenga a x se llama un entorno de 
x. Seaxe € y X C €. Entonces (a) x es un punto de acumulación (o punto 
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límite) de X si todo entorno de x contiene a lo menos un punto de X; (b) x 
es un punto fronterizo de X si todo entorno de x contiene a lo menos un 
punto de X y un punto de EXX; (b) x es un punto interior de X si por lo 
menos un entorno abierto de x (esto es, un subconjunto de é que contiene a 
x y pertenece a Y) no contiene ningún punto que no pertenezca a X (según 
esta definición, x sólo puede ser un punto interior de X, six e X). La unión 
de X y el conjunto todos sus puntos de acumulación se llama la clausura de 
X. El conjunto de todos los puntos fronterizos de X se llama la frontera de 
X. El conjunto de todos los puntos interiores de X se llama el interior de X. 
Se puede demostrar fácilmente que todo abierto es idéntico a su propio inte- 
rior y que todo cerrado es idéntico a su propia clausura; además, la clausura 
de cualquier conjunto X < 8 es igual a la unión de su interior y su frontera. 

Sean (8,7) y (€',T") dos espacios topológicos y f una 'aplicación de 8 
en 8'. Decimos que f es una aplicación continua si y sólo si la pre-imagen 
por f de cada abierto de (€',3”) es un abierto de (8,3). En otras palabras, 
f:€ = €' es continua si y sólo si, para cada X e T”, FU) e Y. Si la 
aplicación continua f:8 —= Y' es biyectiva y su inversa f71:8" — 8 también 
es continua, f es un homeomorfismo, esto es, un 'isomorfismo de espacios 
topológicos, y (8,3) y (8',J') son espacios homeomórficos (vale decir, 
indistinguibles en cuanto espacios topológicos). 


Grupo. Sea Y un conjunto no vacío, e un elemento determinado de Y, i una 
“operación algebraica unaria en Y y 6) una operación algebraica binaria en 
8. (4,e,1,9) es un grupo si se cumplen las tres condiciones siguientes: (1) Y 
es asociativa: si x, y, ze 9x0 (y 9z) = (49 y) 9 z; (ii) para cada xe Y, 
xde=e0 x= x; (111) para cada xe Y, x 9 ¡(x) = i(x) O x= e. La ope- 
ración (9 se llama el producto del grupo, e es el elemento neutro, i(x) es el 
elemento inverso de x. Normalmente, se escribe xy en vez de x Y y y el 
elemento inverso de x se llama x”! en vez de i(x); en el caso de ciertos gru- 
pos es tradición escribir x + y por x 6 y y llamar —x al inverso de x. 


Grupo abeliano. El grupo (8,e,i,9) es abeliano si la operación Y es conmu- 
tativa, esto es, si (x 9 y) = (y O x) para cada par de elementos si x, y e Y. 


Isomórfico, isomorfismo. Sea f una aplicación biyectiva de un conjunto 4 
en un conjunto %. Si 4 tiene una estructura —digamos, un orden parcial, o 
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una estructura de cuerpo o de espacio topológico— f induce en %B una es- 
tructura de la misma clase. Por ejemplo, si 4 contiene en virtud de su es- 
tructura un elemento distinguido e, f(e) es un elemento distinguido de RK en 
virtud de la estructura inducida por f; si la estructura de «4 está definida (en 
parte) por una relación diádica R y aRb, la estructura inducida estará defini- 
da (en parte) por una relación diádica R* tal que f(a)R*f(b); si la estructura 
de 4 incluye una operación binaria que asigna el objeto z e 4 al par de 
objetos x, y e sl, la estructura inducida asigna precisamente el objeto f(z) al 
par de objetos f(x) y fGy); si la estructura de 4 selecciona una clase J de 
subconjuntos de 4, la estructura inducida selecciona una clase Y* de 
subconjuntos de % tal que Xe I si y sólo si f(X) e€ Y*. Supongamos aho- 
ra que tanto 4 como % tienen una estructura y que la estructura de % coin- 
cide con la estructura inducida por f. Decimos entonces que la biyección f 
es un isomorfismo. En tal caso, obviamente, la biyección inversa f-! tam- 
bién es un isomorfismo. Dos conjuntos estructurados 4 y B son isomórficos 
si existe un isomorfismo entre ellos. 


Operación algebraica. Si € es un conjunto cualquiera, llamamos “€” al con- 
junto de todos los n-tuplos ordenados que pueden formarse con elementos 
de € (€"= ((x,, ... »x,):x, € €, 1<k<n). Una operación algebraica n-aria 
en un conjunto “6 es sencillamente una aplicación de €” en €. En vez de 
“operación algebraica”, solemos decir “operación”. Si f:6? —> € es una ope- 
ración binaria matemáticamente significativa (como la suma o la multiplica- 
ción de enteros, etc.) es corriente simbolizarla mediante un ideograma ad 
hoc (+, x, etc.) que se intercala entre los miembros del par ordenado a que 
se aplica la operación: escribimos “5 + 3”, en vez de +((5,3)). Consideremos 
ahora una operación binaria * en un conjunto “€. Decimos que * es conmu- 
tativa si para cualesquiera objetos x, y € €, x x* y = y x x. Decimos que * es 
asociativa si, para cualesquiera objetos x, y, z€ G,xx* (yp*Z)=(Ax*y)x*Z2. 
Si e es otra operación binaria en € decimos que x es distributiva con res- 
pecto a e si, para cualesquiera objetos x, y, z€ E,xx* (yez)=(xx*y e (x 
* Z). 


Orden. Considérese un conjunto “€ y una relación diádica < entre pares or- 
denados de elementos de “€. Para indicar que a e “€ tiene la relación < con 


be € escribimos “a < b” (en vez de <(a,b)). Diremos que < define un orden 
parcial en € y que € está parcialmente ordenado por <, si se cumplen las 
condiciones siguientes: 


(1) la relación < es reflexiva: si a e €, a< a; 
(11) la relación < es antisimétrica: a < b y b< a sólo si a = b; 
(11) la relación < es transitiva: si a < b y b< c, entonces a < c. 


Decimos que < define un orden total en “€ y que € está totalmente ordena- 
do por <, si además de las condiciones (1), (11) y (111) se cumple la condición 
siguiente: 


(1v) sia, be €, entonces siempre ocurrirá que a < bo que b< a. 


En vez de “orden total” suele decirse “orden simple” u “orden lineal”. Dado 
un orden total definido por la relación <, la relación diádica < está definida 
por la condición: a<b si y sólo sia<b y as b. La relación < es asimétrica: 
a < b implica que es falso que b < a. El concepto de orden total puede 
definirse también en términos de una relación transitiva y asimétrica < que 
satisfaga el requisito de tricotomía: si a, be “€, siempre ocurrirá que a < b, 
o que b < a, o que a = b. En tal caso, la relación < definida por la condición 
“a<bsi y sólo sia<bo a = b” define en € un orden total de acuerdo con 
nuestra primera definición. 

Sea “6 un conjunto parcialmente ordenado por la relación <. Sea U c €. 
Decimos que u es un elemento maximal de U si ue U y no existe un v e 
U tal que u < v. Decimos que u es un elemento minimal de U siue U y no 
existe un ve U tal que v < u. Un elemento a e € es una cota superior de 
U si todo x e U cumple la condición x < a. a es una cota inferior de U si 
todo x e U cumple la condición a < x. Si U tiene una cota superior, deci- 
mos que está acotado por arriba; si tiene una cota inferior, decimos que 
está acotado por abajo; si tiene una cota superior y una cota inferior, deci- 
mos simplemente que U es un conjunto acotado. Obsérvese que a lo sumo 
una cota superior de U puede pertenecer a U. Si tal cota superior existe la 
llamamos el máximo de U (abreviado: max U). Obviamente, si max U exis- 
te, es un elemento maximal de U (en efecto, el único). Por otra parte, no 
más de una cota inferior de U puede pertenecer a U. Si tal cota inferior existe, 
la llamamos el mínimo de U (abreviado: min U). Si min U existe, es un 
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elemento minimal de U (en efecto, el único). Supongamos ahora que U tie- 
ne una cota superior p tal que, si q es una cota superior de U, p < q. Obvia- 
mente, no puede haber más de un objeto p con esta propiedad. Si tal objeto 
existe, lo llamamos la cota superior mínima o el supremo de U (abreviado: 
sup U). Del mismo modo, la cota inferior máxima o infimo de U (abrevia- 
do: inf U) es el objeto r tal que r es una cota inferior de U y si r es cual- 
quier cota inferior de U, s < r; obviamente, si inf U existe, es único. 


Partición. Sea € un conjunto y P(€) el conjunto de los subconjuntos (las 
partes) de “€. Decimos que P < P(€) constituye una partición de “€ si cada 
elemento de € pertenece a uno y sólo uno de los conjuntos contenidos en P. 
Si P es una partición de € y x e €, el elemento de P al que pertenece x 
suele llamarse [x]. Sea R la relación entre pares de elementos de “€ definida 
por la condición: xRy si y sólo si x e [y]. En tal caso, [y] es el único ele- 
mento de P a que pertenece x, esto es, [y] = [x]. Por ende, six € [y] y z € 
Lx], ze [y]; esto es, si ¿Rx y xRy, entonces zRy: R es una relación transitiva. 
Como obviamente y e [y], tenemos además que si xRy, yRx: R es reflexiva 
y simétrica. En otras palabras, R es una “equivalencia. Hemos demostrado 
así que toda partición de un conjunto “€ define una equivalencia entre los 
elementos de €. 


Producto cartesiano. Sean A y B dos conjuntos cualesquiera. El producto 
cartesiano Ax B es el conjunto de todos los pares ordenados (a,b) tales que 
ae Aybe B.SiC es un tercer conjunto, Ax Bx C=(Ax B) x C. El 
producto cartesiano de n conjuntos se define en forma análoga. Como es 
obvio, también se puede formar el producto cartesiano de un conjunto con- 
sigo mismo: Ax A = A? =((x,y): x, y e AY. Repitiendo esta operación dos, 
tres, ..., n—1 veces, se obtienen los productos cartesianos A*, 4%, A”. A” es 
llamado a veces el n-ésimo producto cartesiano de A (entiéndase: consigo 
mismo). 
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Teoría de conjuntos 


€ 2 
É niega € 
La,b,cy 2 
Lx: Kxy 4 
c 2 
é 2 
D 3 
PK 3 
N 543 
U 543 
ANB 543 
A” 543 
f:G=>H 541 
fixofoa) 541 
pa 541 
FIG 541 
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10) 31 
€0 319, 422, 443 
[0] 32 
[k] 46 
a <P 32 
x< y 39 
x<X y 39 
S,No Ni 39 
|KI 41 
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Símbolos asociados a determinados autores 
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Ax[M] 369 
(0) 369 
S"¿Hl 370 
G conv H 370 
FREGE 
hb 133 
= 133, 255 
z 169 
¿F(e) 509-510 
GENTZEN 
0 411 
Ts Tr, q 423 
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Pn 336 
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xBy 341 
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Sb (y Z) 346 
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HILBERT 
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a 300 
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La numeración de las páginas indicadas corresponde a la edición impresa en 1998 
y en algunos casos se aparta —aunque solo mínimamente— del presente pdf. 

El índice no cubre la lista de obras citadas. En algunas partidas correspondientes 
a conceptos figuran números de página seguidos de la letra n. Esta letra indica que 
en una nota al pie de la página mencionada hay una referencia importante al con- 
cepto respectivo. La letra n se omite cuando el concepto pertinente se menciona en 
el texto principal de la página, aunque además se refiera a él una nota al pie de la 
misma. En las partidas correspondientes a nombres propios normalmente no se in- 
dica la región de la página en que aparece el nombre respectivo. 

Imitando al Diccionario de María Moliner, el orden alfabético seguido aquí pres- 
cinde de la curiosa convención castellana, que trata la combinación “ch” como una 
sola letra, aunque a todas luces son dos; por ende, “ch” va entre “ce” y “cl”. 


a priori (Hilbert), 308 
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380, 381, 418, 451; véase también 
función de Ackermann 
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acotada; maximización acotada; 
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aleph, 39 

alfabeto, 481, 492, 500 

álgebra de Boole, 3, 4, 542-43 

algoritmo, 247, 365, 376, 390, 391, 
494; para calcular la validez, 493, 
494 

alianza (Bund) de fórmulas en deriva- 
ción, 434 

altura de una fórmula (Herbrand), 263; 
de un secuente (Gentzen), 430 

ambigiedad característica de funciones, 
192 


ámbito de significación, 192, 194, 196 

analítico/sintético, 130n., 177n. 

Andrews, Peter, 259 

antinomia, 188n.; véase también 
paradoja 

antiprenexa: véase fórmula antiprenexa 

aplicación, 42, 118, 152-53, 377n., 
541-42; biyectiva, 541; compuesta, 
541; continua, 546; epiyectiva, 541; 
inyectiva, 541; véase también 
función 

argumento, 94, 541 

Aristóteles, 24, 61, 62, 66, 71, 72, 191 

aritmética: de segundo orden, 174n.; 
finita o primitivo-recursiva, 212-18, 
232, 450; sustantiva, 312n. 

transfinita, 41-43; véase también 
proposición aritmética, relación 
aritmética 

aritmética, consistencia de la, 
318; 

aritmetización de sintaxis, 322-23, 329- 
30, 335-41 

Arquímedes, 99, 291 

Ash, Marshall, 15 

asociativa, operación, 547 


115-16, 


575 


Índice de personas y conceptos 


autológico: véase heterológico/autoló- 
gico 

axioma, axiomatización, 71, 72, 73, 74, 
115, 233-34, 295-97, 302, 304, 305, 
4094-95; razón para aceptar axiomas 
es empírico-inductiva, según White- 
head y Russell, 207 

Axioma de Completud Lineal (Hilbert), 
99n., 291n. 

Axioma de Determinación, 471 

Axioma de Fundación, 102 

Axioma de las Paralelas (Hilbert), 74; 
véase también Postulado V de 
Euclides 

Axioma de Limitación, 99-100 

Axioma de Reducibilidad, 93, 204-209, 
228, 322n., 327; es teorema en 
sistema de von Neumann, 95-96 

Axioma de Reemplazo, 87-90, 91, 96, 
103, 475 

Axioma de Regularidad, 103 

Axioma de Selección, 55, 64, 66, 67, 
68, 79, 83, 87, 92, 96, 102, 103, 
154, 181, 202, 232, 287, 288, 455, 
472-75; descrito como “principio 
lógico”, 66 

Axioma de Separación, 78, 83, 96, 
103, 471 

Axioma del Infinito, 77, 96, 103, 109, 
201-202, 202n., 454, 472; “demos- 
trado” por Dedekind, 154 n. 12 

Axiomas de Ackermann para la 
matemática clásica, 221-22, 225-26 

axiomas de continuidad, 291 

axiomas de la teoría de conjuntos, 52, 
76-79, 80, 93-94; véase también 
Axiomas de von Neumann, Axiomas 
de Zermelo, Axiomas de Zermelo- 
Fraenkel 

Axiomas de Peano para la aritmética 
elemental, 146, 149-51, 156, 174, 
236, 302-303, 309n., 327, 352, 354, 
450, 451 
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Axiomas de Post para el cálculo 
proposicional, 255 

Axiomas de von Neumann para la 
teoría de conjuntos, 95-98, 352 

Axiomas de Zermelo para la teoría de 
conjuntos, 76-79, 186n., 471-72, 475 

Axiomas de Zermelo-Fraenkel (ZF) 
para la teoría de conjuntos, 80, 87, 
174, 352, 455 

axiomas lógicos: (Frege), 141-42, 502- 
503; (Gentzen), 497; (Gúódel), 275, 
531-34; (Post) 255; independencia y 
lógicas alternativas, 294 


Bacon, Francis, 60 

Baker, G. P. , 138 

Baldwin, James M., 191 

Becker, Oskar, 118 

Behmann, Heinrich, 250 

Bernays, Paul, 80, 127, 250, 258, 259, 
268, 274, 278, 287, 288, 293, 304, 
317, 356, 421, 450, 522 

Bernstein, Felix, 26, 64 

Berry, G. G., 189; véase también 
paradoja de Berry 

Birkhoff, Garrett, 90 

Bishop, Errett, x1i, 204, 377 

biyección, 541 

Black, Max, 179 

Bolzano, Bernhard, 8 

Boole, George, 4-5, 66, 129, 145; 
véase también álgebra de Boole 

Boolos, George, 154, 174, 410, 414, 
419, 454 

Borel, Émile, 66 

Bourbaki, Nicolas, 318 

Brouwer, Luitzen Egbertus Jan, xi, 25, 
27,93, 116, 117, 118, 119, 121, 
124, 125, 204, 207, 377, 535-540 

Biichi, J. R., 419 

buen orden, 34; véase también conjunto 
bien ordenado; Teorema del Buen 
Orden 
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Burali-Forti, Cesare, 53, 465-68; véase 
también paradoja de Burali-Forti 


cadena (Kette), 154 

calculable, 321n., 375-76, 382; efecti- 
vamente, 373, 375, 382n.; “en 
principio”, 359n.; véase también 
computable 

calculista (computer), 382, 389-92 

cálculo lógico, 312n., 376, 527-28; 
compacto, 290; completo, 257-58, 
273, 496; correcto, 258, 495, 528; 
efectivo, 243n., 247, 429; véase 
también cálculo predicativo; cálculo 
proposicional; sistema formal 

cálculo predicativo, 480-502 

cálculo predicativo de primer orden, 
481-91; con identidad, 491-93; 
definición, 274n.; es completo, 273- 
94; es indecidible, 418-19 

cálculo predicativo de segundo orden, 
500-501 

cálculo predicativo monádico, 522; es 
decidible, 522-24 

cálculo proposicional, 253, 2535-58, 
482n.; es completo, 525-27; es 
decidible, 256-57, 494 

Calímaco, 191 

Cantor, Georg, x1, x11, 7-70, 75, 79, 90, 
96, 102, 115, 117, 118, 119, 151, 
296, 297, 299, 422, 441, 442, 443, 
459-64, 465, 467, 468, 477, 505, 
535; véase también paradoja de 
Cantor; paraíso de Cantor; principios 
generadores de Cantor; Teorema de 
Cantor 

cardinal, 33, 39; definición de von 
Neumann, 92; de la clase K, 200; 
inaccesible, 105, 106, 110 

cardinalidad, véase numerosidad 

Carnap, Rudolf, 125 

Cartan, Henri, 377 
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categórica (teoría), 76, 98, 101 

Cauchy, Augustin-Louis, 61, 62, 69, 
310; véase también secuencia de 
Cauchy 

cerrado lógicamente, 84 

César, Cayo Julio, 166 

Chang, C. C., 483 

Christoffel, Elwin Bruno, 297, 298 

Church, Alonzo, 196n., 199, 259, 271, 
317, 354, 359, 360, 365, 369-81, 
382, 417, 418, 421, 494; véase 
también Teorema de Church, Tesis 
de Church 

Chwistek, Leon, 205 

Cicerón, Marco Tulio, 191 

círculo vicioso, principio del, 187, 190, 
192, 194, 196, 205, 208n., 209 

clase, 2, 5, 41, 49, 50, 71, 95, 179, 
182, 186, 200, 206; nula, 200; 
perfectamente ordenada, 465; 
Principia Mathematica neutral ante 
la existencia de clases, 187, 200n., 
208; propia, 95, 183, 184n. 

clase-como-muchos/clase-como-uno, 
179, 179n.-181n. 

clases, teoría sin, 183, 184, 185-87, 
200n.; relación con “teoría susti- 
tucional de las clases”, 184n. 

clausura (topología), 546; universal (de 
una fórmula), 484 

Cocchiarella, Nino, 179 

codominio, 153n., 541 

Coffa, J. Alberto, 177 

Cohen, Paul J., xi, 455, 475 

compacto, 290 

complemento, 2 

completo en el sentido de Post, 258, 344 

completud (Vollstiindigkeit), xi11, 99n., 
126n., 296; véase también cálculo 
completo 

componente (de una formula), 488 

computable, 321, 359, 375-76, 382 
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computable: véase también calculable; 
funciones recursivas; números 
computables 

computable según Turing: véase T- 
computable 

computadora, 90, 390n., 416; véase 
también calculista 

concepto, 510; véase también extensión 
de concepto 

conclusión, 495 

conectivo principal de fórmula, 430 

conectivos, 424 

conjunción, 327, 490 

conjunto (Menge), 1, 7-11, 71, 93, 94, 
110, 152, 179, 182, 186, 237, 303n. 
(véase también axiomas de la teoría 
de conjuntos); acotado, 544, 548; 
bien definido, 9, 10, 11, bien 
ordenado 34, 35, 459-63 (véase 
también buen orden, segmento); 
derivado, 19, 31; potencia, 78, 96, 
471; unitario, 3, 19, 152; vacío, 3, 
4, 10, 20, 77, 103, 152 (véase 
también clase nula) 

conjuntos similares, 45 

conmutativa, operación, 547 

consecuencia lógica, 487 

consistencia (Widerspruchslosigkeit), 
consistente, xiii, 80, 116n., 126, 
235, 241, 292n., 296, 297, 305, 344, 
350. 429-30; absoluta y relativa, 
116; como criterio de existencia, 
118-19, 293; criterio de (Acker- 
mann), 221; prueba directa, 302; 
según Frege, sólo puede demostrarse 
exhibiendo un ejemplo, 122; wm- 
consistencia, 344, 350; véase 
también aritmética, consistencia de 

consistente, pluralidad (o conjunto): 
véase pluralidad consistente 

constante, 482, 500 

construccionismo, 82 
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constructiva, demostración, 257 

contenido (Frege), 131, 134 

continua: véase aplicación continua 

continuo: más numeroso que los 
enteros, 22, 23; véase también 
Hipótesis del Continuo 

contradicción, 300 

convergencia uniforme, 15 

conversión (Church), 370 

Copi, Irving M., 205 

correcto/incorrecto, 220, 235, 300; 
véase también cálculo correcto; 
verdadero/falso 

corte, 425-26; propio, 434; véase 
también Teorema del Corte de 
Gentzen 

cota: inferior, 548; superior, 548; véase 
también ínfimo, supremo 

Couturat, Louis, 68 

cuantificación, 309; acotada, 215; 
universal, 138 

cuantificador, 301, 327; existencial, 
4090; universal, 483, 512n.; véase 
también cuantificación 

cubrimiento (Belegung), en el sentido 
de Cantor, 42 

cuerda de signos, 481n.; véase también 
fila 

cuerpo, 543-45; arquimédico, 115, 202, 
296, 544; completo, 544; ordenado, 
17, 296; véase también números 
complejos, números racionales, 
números reales 


d'Alembert, Jean Le Rond, 8, 13 

Dauben, Joseph, 15, 25, 51, 60, 61 

Davis, Martin, 259, 361, 381, 410 

De Morgan, leyes de, 543 

debilitamiento (Verdiinnung), 426 

decidibilidad, 306; véase también 
decidible, decisión, Entscheidungs- 
problem, indecidibilidad 
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decidible: en sentido de Gúdel (Ent- 
scheidungsdefinit), 250n., 342; v- 
decidible (Entscheidbar), 522-24 

decisión (Entscheidung), 234, 239, 418; 
diversos conceptos de, 250, 250n.; 
procedimiento de (Entscheidungs- 
verfahren), 248, 494; véase también 
Entscheidungsproblem; indecidibilidad 

Dedekind, Richard, xi, xii, 4, 10, 25, 
27,34, 51, 54, 56, 74, 115, 117, 
145, 150, 151-58, 160, 161, 163, 
166, 167, 200, 203, 214, 297, 299, 
305, 307, 468, 476, 477, 478, 504- 
509 

deducción natural, 423, 496-99 

deducibilidad, 250, 495; no equiparable 
a verdad, 325; véase también 
sintáctico/semántico 

definición: implícita, 73-74; por 
inducción transfinita, 216, 476-79; 
recursiva, 476, 480-81, 504 

definido, bien (definit, wohldefiniert), 
9, 78, 81-87 

Demopoulos, William, 174, 455 

demostrable, formula; véase fórmula 
demostrable 

denotación (Bedeutung), 135, 166 

Denton, John, 259 

derivación (Herleitung—Gentzen), 421, 
409; árbol finito de secuentes, 428; 
fatal, 422, 430; trozo final, 431 

Desargues, Girard, 313 

Descartes, René, 7, 61, 99 

descripción definida (Russell), 184-85, 
213n. 

designador distributivo, 56 

Detlefsen, Michael, 319, 358 

diagonal, método/argumento; véase 
diagonalización 

diagonalización, 43, 49, 325, 379n., 
505n., 528 

diagrama, 393; parcial (DP), 394 
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diferencia, 215 

dimensión: invariante bajo biyecciones 
bicontinuas, 27, 535 

diofántica, ecuación, 270n. 

Diógenes Laercio, 191 

Dirichlet, Peter Lejeune, 8, 13, 14 

distributiva, operación, 547 

disyunción, 490 

divisible, 215 

división, 215 

Dodds, E. R., 165 

dominio, 94, 486; de una aplicación, 
153, 541; normal (Zermelo), 103, 
106-109; unitario (Zermelo) 

Dreben, Burton, 249, 259, 287 

du Bois-Reymond, Paul , 43, 505 

duo-unidad (two-oneness, Zwei- 
einigkeit— Brouwer), 536 


ecuación numérica (Zahlgleichung), 
251n.; detenible (Haltgleichung), 
252; huidiza (Fluchtgleichung), 252; 
idéntica, 252; véase también diofán- 
tica, ecuación 

elevación de tipo (Gódel), 329 

Enestróm, G., 61 

entorno, 545 

Entscheidungsproblem (problema de la 
decisión), 248-71, 292, 341, 353, 
358n., 360, 377, 380, 418-19 

enumerable recursivamente, 341n., 371- 
72 

enumerador (Anzahl), 32, 33 

enunciados finitos, 311, 314, 315 

enunciados ideales, 311-316 

epiyección, 541 

epsilóntica, 310 

equinumerosidad: de algebraicos con 
enteros, 22-23; de segmento recto 
con cuadrado, 22, 25-26 

equinumeroso, 21, 168, 169 


Índice de personas y conceptos 


equivalencia, 17, 169, 327, 336n., 490, 
545, 549; clases de, 169, 545; 
deductiva, 278; lógica, 278, 487 

escepticismo, argumento contra, 198n. 

escritura conceptual (Begriffschrift), 50, 
131-42, 174, 493n., 509 

escritura universal (Leibniz), 129 

espacio: absoluto, 159, euclidiano, 73, 
74, 9%9n., 291n., 115, 295-96; 
topológico, 5435-46 

esquema, 302 

esquemas de inferencias (Gentzen), 
426-28, 498 

estructuralismo matemático, 159, 200 

Etchemendy, John, 377 

Eubúlides de Mileto, 191 

Euclides, 35, 71, 99, 315 

Eulenburg, A., 57 

Eurípides, 165 

existencia de objetos matemáticos, 58- 
59, 118-19, 122, 293 

exponenciación, 509 

expresar, expresable, 528 

expresión, 530 

extensión: de aplicación, 541; de 
concepto, 2, 4, 41, 168, 169, 509- 
16; de teoría, 344 


factores primos, 329 

fila, 481 

Filón de Megara, 138 

finitismo, 360n.; de Cantor (según M. 
Hallett), 62n.; de Hilbert, 121n., 
123, 124, 126, 298n., 308-309, 454; 
necesidad de ampliar este punto de 
vista, 127n., 421, 422, 452; véase 
también aritmética finita; finito 
(finit); sustantivo (inhaltlich) 

finito, (finit), 127n., 219, 221, 317, 
442, 452; véase también enunciados 
finitos 

forma normal, 366, 371, 415 
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formal o formalista, razonamiento 
(opuesto a razonamiento sustantivo), 
124n., 254; véase también sistema 
formal 

formalismo, 306, 307; véase también 
formalización; programa de Hilbert; 
sustantivo 

formalización, 122, 295-97, 299, 304 

fórmula, 232, 327, 369, 483, 492, 500; 
abierta, 484; antiprenexa, 263, 
267n.; atómica, 254; bien formada 
(f£bf), 369; cerrada, 278n., 484; 
deducible o demostrable, 234, 250, 
275, 276, 324, 325; elemental, 254, 
261, 327, 424, 483; lógica, 274n.; 
numérica, 220; prenexa, 197n., 263, 
267n., 516-22; prenexa de Skolem, 
519, 521, 522; prenexa de seudo- 
Skolem, 519n.; principal de una 
inferencia (Gentzen), 426; regular, 
263, 517; válida, 251; verdadera 
(Herbrand), 260; verdadera (Tarski), 
486; verifuncional, 254, 260, 482n., 
488 

Fourier, Joseph, 14 

Fraenkel, Abraham, 76, 80, 83, 87, 88, 
91, 93, 99, 207, 472-75 

Frege, Gottlob, xi, xi, 2, 41, 50, 51, 
66, 73, 80, 117, 118, 122, 125, 130- 
43, 145, 146, 148, 151, 153, 159-735, 
189, 200, 213, 234, 273, 292, 295, 
297, 298, 303, 305, 307, 308, 325, 
376, 493, 494, 502-503, 509-16 

Freudenthal, Hans, 159 

Fries, Jakob Friedrich, 7 

frontera, 546 

fugitiva, propiedad, 539-40 

función, 13, 14, 83, 88, 94, 118, 131, 
135, 136, 137, 153, 237, 476n., 510, 
542; característica, 43, 385n.; de 
Ackermann, 362n., 375; diagonal, 
528; A-definible, 369, 371, 376, 377, 
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382; numérica, 359, 387; parcial, 
215, 359, 368; predicativa, 190n., 
198; proposicional, 49, 50, 86, 180, 
181, 192, 196, 197, 200, 211, 212n.; 
total, 359, 364; veritativa, 208 

funcional, 220 

funciones computables, 359-419 

funciones recursivas, 321, 330-34, 361- 
68, 371, 376, 377, 377n.; cursiva 
usada para nombrarlas, 336n.; “en el 
sentido de Herbrand-Gódel”, 364, 
415n.; en el sentido restringido de 
Gódel (1931), 331, 333; generales, 
362, 364, 382; parciales, 368; 
primitivas, 331-33, 331n., 361; todas 
son T-computables, 407-10; 

funciones T-computables, 363, 377n., 
382, 407; todas son recursivas, 410- 
15 

functor, 85-86, 492, 500 


Gauf, Carl G., 61, 62, 310 

Geach, Peter, 515 

generalización irrestricta es prescindible 
(Skolem), 212; véase también 
cuantificación acotada 

generalización universal, 140, 276, 327 

Gentzen, Gerhard, xi, 318, 319, 421- 
55, 496, 487, 499, 531-34 

geometría euclidiana: véase espacio 
euclidiano 

geometría proyectiva, 313-14 

Gergonne, Joseph-Diez, 73 

Gillies, Donald A., 145 

Gódel, Kurt, xi, x11, 43, 80, 87, 95, 
126, 127, 142, 143, 178, 209, 211, 
243, 244, 250, 251, 254, 259, 270, 
2773-94, 295, 316-19, 321-58, 360, 
361-68, 381, 385, 390, 415, 417, 
421, 423, 450, 451, 454, 455, 496, 
527, 529, 531 

gódel, 329-30, 384-835, 529-30 
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Goldfarb, Warren, 130, 249, 259, 270 
grado: de una fórmula (Gentzen), 430; 
de una K-fórmula (Gódel), 279 

grafo, 510-11, 542 
Grattan-Guinness, I., 51 
Grelling, Kurt, 189n. 
Grinder, Karlfried, 454 
grupo, 546; abeliano, 546 
guédel, 329n. 


Hacker P. M. S., 138 

Hall, A. Rupert, 159 

Hall, Mary Boas, 159 

Hallett, Michael, 62 

Hartogs, F., 40 

Hausdorff, Felix, 105, 477 

Heijenoort, Jean van, 83, 212, 251, 
259, 287, 299 

Helmholtz, Hermann, 297 

Henkin, Leon, 273 

Henkin, Leon, 501 

Herbrand, Jacques, 125, 241-46, 247, 
249, 250, 251, 259-71, 273, 292, 
306, 317, 322, 360, 362, 363, 415 

hereditaria, propiedad, 161, 162 

Hermes, Hans, 363, 366, 405 

Hermite, Charles, 310 

Hessenberg, G., 42 

heterológico/autológico, 189n. 

Heyting, Arendt, 125 

Hilbert, David, xi, xii, 54, 63, 71, 73, 
74, 75, 76, 84, 99, 115-27, 129, 
130, 145, 160, 167, 197, 211, 213, 
219, 220, 225, 226, 239, 248, 249, 
250, 273, 276, 283, 287, 288, 292, 
295-319, 322, 324, 325, 335, 354, 
380, 381, 421, 450, 451, 494, 544; 
véase también problemas de Hilbert 
para el siglo XX; programa de 
Hilbert 

hilo (en derivación), 431; completo, 
431 
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Hipótesis del Continuo (HC), 27, 40, 
44, 55, 63, 64, 115 

Hipótesis Generalizada del Continuo 
(HGC), 40-41, 44, 106, 455 

Hobson, E. W., 181, 182 

homeomorfismo, 546 

hueco, 510n. 


ideales, elementos, 311; véase también 
enunciados ideales 

idempotente (operación), 543 

identidad (aplicación), 153n.; (fórmula), 
260, 269; (relación), 199 

identidad, signo de, 327, 336n., 492; 
ambiguo en Principia Mathematica, 
200; no es signo lógico en cálculo 
de Gentzen, 424; utilizado para 
simbolizar equivalencia, 142n., 148 

imagen (de aplicación), 541 

implicación, 138n., 139, 327, 481 

impredicativo como sinónimo de 
“transfinito”, 237: véase también 
predicativo/impredicativo 

inclusión, 153n. 

incompleto en el sentido de Post, véase 
completo 

inconsistente: véase consistencia, 
pluralidad inconsistente, w-consisten- 
te 

indecidibilidad, indecidible, 235; véase 
también decidibilidad, decidible, 
decisión, Entscheidungsproblem 

independencia, 83, 305, 472, 475 

individuo, 193 

inducción matemática 150, 163, 216, 
217, 219, 243, 286, 298n., 309n., 
428, 450, 474-75; forma intuitiva, 
298n., 309n.; transfinita, 477; véase 
también definición por inducción 
transfinita; inducción transfinita 
hasta el ordinal eq; recursivo, modo 
de pensar; Teorema de la Definición 
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por Inducción; Teorema de la 
Inducción Completa 

inducción transfinita hasta el ordinal 
eq» 319, 421, 449, 451n., 452 

inferencia, 497; figura de (Schluf- 
figur—Gentzen), 425; reglas de, 
220, 275-76, 426-28, 495, 498; 
véase también corte; debilitamiento; 
generalización universal; modus 
ponens; regla (w; reglas estructurales; 
reglas de eliminación e introducción; 
sustitución, regla de 

ínfimo (cota inferior máxima), 549 

infinitésimos, 310 

infinito: absoluto, 51; actual, 24, 29, 
61, 62, 451, 454; definición de 
Dedekind, 154; impropio (Uneigent- 
lich-unendliches), 29; limitaciones 
humanas no impiden estudiarlo, 
según Cantor, 57-58; postura de 
Gentzen, 451; potencial, 24, 29, 
451; una manera de hablar, 311; 
véase también punto en el infinito 

insaturada, expresión, 510n.; véase 
también saturado 

interior, 546 

interpretación, 486 

intuición: concepción hilbertiana, 308; 
crisis decimonónica, 26-27, 535 

intuicionismo, 82, 237, 451n. 

intuicionista, como sinónimo de 
“sustantivo” (q.v.), 125n., 232, 243, 
244n., 247, 363n. 

inversa, biyección, 547 

inverso, elemento (en grupo), 546 

inyección, 541 

irracionalidad de vV2, 315n. 

irrealizable, 487 

Isaacson, David, 317 

isomorfismo, 546-47; canónico, 18 
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Jacobi, Carl Gustav Jacob, 310 
Jafíkowski1, Stanislaw 

Jeffrey, Richard, 131, 410, 414 
Jevons, William Stanley, 129, 145 
Johnson, Dale M., 27 

Jourdain, Philip, 67, 183 


Kalmár, L., 363 

Kant, Immanuel, 7, 130, 308 

Keisler, H. J., 483 

Kepler, Johannes, 313 

Kleene, Stephen, 250, 331, 360, 361, 
365-68, 369, 372, 377, 410, 415, 
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Kronecker, Leopold, xi, 15, 33, 117, 
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Lackey, D., 186, 187 
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Lebesgue, Henri, 66, 98, 232 
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159, 310, 493 
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Levy, Azriel, 26, 42, 92 
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Lindemann, Ferdinand, 376 
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Lobachevsky, Nikolai Ivanovich, 74, 
116 
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damental según Herbrand, 262 
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lógica: véase axiomas lógicos, ley 
lógica, verdad lógica 

lógicas alternativas, 294 

logicismo, 161n., 174n., 201, 202 
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Lorenzen, Paul, xi, xi1, 204, 377 

Lotze, Rudolf Hermann, 61 
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Teorema de Lówenheim-Skolem 
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386, 389, 416-17 
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negación, 481; reglas de, 498; simbo- 
lismo hilbertiano, 275n. 
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numerosidad, 21, 39, 463-64, 536n. 
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parte (subconjunto), 2 

parte propia, 2 

partición, 545, 549 

Pascal, Blaise, 313 

Pasch, Moritz, 72, 73, 295, 313 
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predicativo/impredicativo, 69-70, 182, 
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tiva 
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primitivo-recursiva, funciones 
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reglas estructurales, 497, 498 
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restricción (de aplicación), 541 

Riemann, Bernhard, 7, 15, 16, 98 

Ritter, Joachim, 454 
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51, 68, 69, 93, 122, 125, 126, 130, 
143, 177-210, 211, 212, 213, 215, 
234, 247, 248, 249, 253, 254, 260, 
273, 304, 305, 308, 328, 376, 496, 
512, 515, 518; véase también 
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Schilpp, Paul A., 179 
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Schónfinkel, M., 250, 268, 522 

Schopenhauer, Arthur, 535 

Schróder, Ernst, 2, 26, 52, 129, 145, 
214, 251, 520 

Schiitte, Kurt, 451, 454 

secuencia de Cauchy, 16, 24, 98, 121, 
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secuencia de Cauchy; (Zermelo), 
104 

secuente, 424. 496-97; básico lógico 
(SBL), 428, 497; básico matemático 
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vacío, 424; válido, 424 
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sentencial, cálculo, 253n.; véase 
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to, 161 

serie natural de los números (Frege), 
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serie numérica, la: véase números 
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Sheffer, H. M., 208n. 

Shoenfield, Joseph R., 174 

signo individual, 500 

signos como objeto de la aritmética, 
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similares 
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sintáctico/semántico, 210, 275, 278; 
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sintaxis, aritmetización: véase aritme- 
tización de sintaxis 

sintético; véase analítico/sintético 
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to”, 10, 74, 121, 152 
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cálculo predicativo de primer orden, 
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correcto 
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ma de Lówenheim-Skolem 

Smith, H. L., 377 

Smorynski, C., 315, 358 
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Soare, Robert I., 454 

Sobociñski, Bolestaw, 515 

software, 90, 416 

solubilidad de todos los problemas 
matemáticos, 249n., 293, 306, 539 

Spinoza, 60, 61 
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subfórmula, 484 

subtracción, 215 

sujeto y predicado, 134, 136 

suma mereológica, 181n. 

supremo (cota superior mínima), 69, 
202-204, 205, 544, 549 

sustantivo (inhaltlich), 123-24, 124n., 
125n., 243n., 254, 306, 312n. 

sustitución de variables, 370; regla de, 
220, 276n., 302n.; signo de, 234 

Szabo, M. E., 426, 451 


T-computable: véase funciones T- 
computables 

tablas de verdad, 494 

Takeuti, Gaisi, 454 

Tarski, Alfred, xi, xii, 98, 210, 251, 
277, 377, 451, 454 

tautología, 241, 261n., 328, 487-88 

Teorema de Cantor, 30, 42, 43, 49, 50, 
179,325, 515n., 516n. 

Teorema de Church, 353, 354n., 360, 
369-81, 418-19; uso peculiar del 
nombre por Kleene, 378n. 

Teorema de Completud de Gódel, 273- 
94, 381, 418 
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Teorema de Lówenheim-Skolem, 87, 
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Teorema de Pitágoras, 73 

Teorema del Buen Orden, 35, 40, 54, 
55, 63, 64-65, 66-67, 68, 181, 207, 
468-70 
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Teorema Fundamental del Álgebra, 69 
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cálculo proposicional, 256-57 
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126, 127, 295, 321-58; primer 
teorema: enunciado, 347; demostra- 
ción, 347-50; discusión general, 
326-53; forma abstracta, 527-30; tres 
corolarios, 352-53; segundo teorema, 
354-57 

teoría de la prueba (Beweistheorie), 
124, 125, 304-16, 340n., 454 

Tercero excluido, 9, 117, 118 n., 119, 
124, 219, 221, 222n., 309-10, 538- 
39 
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excluido 

Tesis de Church, 331, 353, 354n., 360, 
369-81, 386, 417, 418, 494 
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Tiles, Mary, 177 

tipo lógico, 180, 192-204; teoría rami- 
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228, 322n.; teoría simple, 192-94, 
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transfinito, véase aritmética transfinita; 
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principios generadores de Cantor 
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trozo final (Endstiick) en derivación, 
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semántico 
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valor lógico (Herbrand), 260 
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también verdadero/falso 

valuación parcial, 239 
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van Dalen, Dirk, 119 

van Stigt, Walter P., 1979 

variable, 481, 482, 500; aparente, 241 
(véase también variable ligada); 
funcional, 500; general, 263; 
individual, 500; libre, 369, 484; 
ligada, 369, 484; predicativa, 500; 
propia de una inferencia, 425; 
proposicional, 482; restringida, 263; 
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verdad en un sistema formal (Tarski), 
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verdad matemática no es equiparable a 
deducibilidad en un sistema consis- 
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verdadero/falso, 260, 486-87; en un 
campo infinito, 268-69; véase 
también correcto/incorrecto; tablas 
de verdad; valor veritativo 

verifuncional; véase fórmula verifun- 
cional 

Veronese, Giuseppe, 60 

versalitas: uso simbólico en Capitulo 
2.10, 335 

versión, 482-83, 492 

Viena, Círculo de, 125 

Vivanti, 60 
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vocabulario, 482 
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50, 122, 126, 130, 178, 187, 190, 
192-208, 211, 212, 215, 234, 247, 
248, 253, 254, 260, 273, 328, 496, 
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Wright, Crispin, 145, 172, 173, 174 
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55, 64-70, 71-87, 88, 89, 93, 97, 98, 
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Axiomas de Zermelo, Axiomas de 
Zermelo-Fraenkel 

zigzag, teoría del, 183 
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